Ich habe ein Programm, das einige Daten aus dem Internet herunterladen und speichern Sie es als csv
, und laden Sie diese Daten dann auf Google Cloud Storage Bucket
. Als nächstes wird das Programm gsutil
verwenden, um eine neue Google BigQuery Table
zu erstellen, indem alle Dateien in der Google Cloud Storage Bucket
verkettet werden. Um die Verkettungs führe ich diesen Befehl in command prompt
:Google BigQuery: Wie benutze ich gsutil um eine Tabelle zu entfernen oder zu überschreiben?
bq load --project_id=ib-17 da.hi gs://ib/hi/* da:TIMESTAMP,bol:STRING,bp:FLOAT,bg:FLOAT,bi:FLOAT,lo:FLOAT,en:FLOAT,kh:FLOAT,ow:FLOAT,ls:FLOAT
Das Problem ist, dass aus irgendeinem Grund dieser Befehl an die vorhandene Tabelle anhängt, so bekomme ich eine Menge von doppelten Daten. Die Frage ist, wie kann ich entweder gsutil
verwenden, um die Tabelle zuerst zu löschen, wie kann ich gsutil
verwenden, um die Tabelle zu überschreiben?
Dies ist, was ich gesucht habe. Die einzige Möglichkeit, dies zu verbessern, wäre das Hinzufügen der project_id, so dass der Befehl wie folgt aussehen würde: 'bq rm -f -t --project_id = ib-17 da.hi' – user1367204