Ich führe einige Benchmarks in einer Datenbank durch und frage mich, ob es öffentlich verfügbare Datensätze gibt, die über 1T Zeilen enthalten?Öffentlicher Datensatz in Billionenreihen?
Ich weiß Google Big Query hat ein paar öffentlich verfügbare Datensätze, die 100M + (wikipedia, gdelt-Ereignisse) und 1B + (nyc-tlc) Reihen sind, konnte aber nichts größeres finden. Kennt jemand einen 1T-Datensatz, der entweder heruntergeladen werden kann?
Einige Referenz Links:
Die Verarbeitung eines Billionen-Datensatzes kann sehr teuer sein, insbesondere wenn Sie Ihre Abfragen nicht sorgfältig schreiben. Machen Sie einige Berechnungen, bevor Sie beginnen. –