BigQuery ist schnell bei der Verarbeitung großer Datenmengen, das Abrufen großer Ergebnisse aus BigQuery ist jedoch überhaupt nicht schnell.BigQuery Retrieval Zeiten langsam
Zum Beispiel habe ich eine Abfrage ausgeführt, die 211.136 Zeilen über drei HTTP-Anfragen zurückgegeben hat, wobei etwas mehr als 12 Sekunden insgesamt.
Die Abfrage selbst wurde vom Cache zurückgegeben, sodass keine Zeit für die Ausführung der Abfrage benötigt wurde. Der Hostserver ist Amazon m4.xlarge, das in US-East (Virginia) ausgeführt wird.
In der Produktion habe ich gesehen, dass dieser Prozess ~ 90 Sekunden dauert, wenn ~ 1Mn Zeilen zurückgegeben werden. Offensichtlich könnte dies auf Netzwerkverkehr zurückzuführen sein ... aber es scheint zu langsam zu sein, als dass dies die einzige Ursache wäre (diese 211.136 Zeilen waren nur ~ 1.7MB).
Hat jemand andere solche langsame Geschwindigkeit bei der Rückkehr Ergebnisse gefunden, und eine Lösung gefunden?
Update: Reran Test auf VM in Google Cloud mit sehr ähnlichen Ergebnissen. Ausschluss von Netzwerkproblemen zwischen Google und AWS
könnten Sie bitte die Job-ID angeben? – xuejian
@xuejian job_BAp8OdilQEzuV7x6HNeEzVh2lo8 – NPSF3000
Sorry, vergessen zu erwähnen: Projekt-ID wird auch benötigt. – xuejian