Ich habe eine Tabelle, die etwa 25-30 Millionen Zeilen und 15 Spalten hat. Die meisten von ihnen sind statisch oder erhalten Echtzeit-Updates. Aber für einige der Spalten (3 bis 4) bekomme ich die Daten von hdfs einmal pro Tag und aktualisiere es, was bedeutet, dass diese Spalten einmal am Tag aktualisiert werden müssen.Der beste Weg, um 3-4 Spalten in einer Tabelle von 30 Millionen täglichen Aufzeichnungen zu aktualisieren
Ich habe versucht, eine neue Tabelle aus der hdfs-Ausgabe zu erstellen und dabei auf die Haupttabelle zu kommen, aber das scheint ewig zu dauern. Ich habe versucht, Batch-Updates zu tun, aber das dauert auch zu lange.
Was ist der beste Weg, dies zu tun?
ich Postgres als meine db
Wenn Sie Daten aktualisieren möchten, müssen Sie sich zuerst für die von Ihnen verwendete Datenbank entscheiden und die Frage entsprechend kennzeichnen. Ich habe die überflüssigen Datenbank-Tags entfernt. –
@GordonLinoff bearbeitet die Frage. Ich habe andere relational dbs auch markiert, so dass Leute mit ähnlicher Erfahrung und mit einigen anderen rdbms und nicht Postgres geben auch Eingaben hier – Peter
@Peter Probleme und Lösungen dieser Art neigen dazu, RDMS spezifisch sein, sondern kann auch zu anderen DBs. Wenn Sie generec Lösung für alle wollen, verwenden Sie einfach sql-Tag. Es wäre auch unmöglich, einen "besten Weg" für alle zu finden. – Alex