Ich habe eine Csv-Datei, die 217GB ist, wie kann ich die Anzahl der eindeutigen Spaltenwerte mit Python oder PHP-Skript ohne Zeitüberschreitung erhalten?Anzahl der eindeutigen Spaltenwerte aus großen CSV-Datei mit Python oder PHP
0
A
Antwort
1
Nicht sicher, was Sie mit Timeout meinen, für große Dateien wie diese wird es immer eine lange Zeit dauern.
tokens = {}
with open("your.csv") as infile:
for line in infile:
columns = line.split(',')
# Where idx is your desired column index
if columns[idx] not in tokens:
tokens[columns[idx]] = 0
else:
tokens[columns[idx]] += 1
print tokens
Diese lädt die Datei Zeile für Zeile, so dass Ihr Compute von dem Laden der gesamten 217 Gb in den Arbeitsspeicher nicht abstürzt. Sie können dies zuerst ausprobieren, um zu sehen, ob das Wörterbuch in den Speicher Ihres Computers passt. Andernfalls möchten Sie vielleicht die Dateien in kleinere Teile aufteilen, um sie zu teilen.
-1
Sie könnten versuchen, die field_size_limit
import csv
csv.field_size_limit(1000000000)
r = csv.reader(open('doc.csv', 'rb'))
for row in r:
print(row) # do the processing
Verwandte Themen
- 1. Pandas: Summieren Anzahl der Spaltenwerte mit groupby
- 2. Count Anzahl der eindeutigen Zeilen Matlab
- 3. Wie Spaltenwerte mit Python Summe
- 4. Powershell bekommen Anzahl der Zeilen der großen (großen) Datei
- 5. Zurückgeben von eindeutigen Wörtern aus der Textdatei mit Python
- 6. Anzahl der eindeutigen finden in der Unterklasse
- 7. Python - Aufteilen einer großen Zeichenfolge nach Anzahl der Trennzeichen
- 8. mysql SORTIEREN NACH Anzahl der eindeutigen Worttreffer
- 9. Anzahl der eindeutigen Werte pro Zeile zählen
- 10. Crosstab mit einer großen oder undefinierten Anzahl von Kategorien
- 11. Anzahl der eindeutigen Werte pro Spalte Gruppe
- 12. Paginierung mit einer großen Anzahl von Datensätzen
- 13. Erhalten von eindeutigen Werten aus der Spalte
- 14. MySQL - Count Anzahl der eindeutigen Werte
- 15. python sqlalchemy distinct Spaltenwerte
- 16. Datenbankstrukturen mit einer großen Anzahl von Bitfeldern
- 17. finden eindeutigen Wert aus der Tabelle in php
- 18. Eindeutige sortierte Liste der Spaltenwerte aus 2 Tabellen
- 19. Summe der Spaltenwerte in Python vergleichen
- 20. Spaltenwerte in CSV mit Python ändern
- 21. Deal mit großen Arrays in php
- 22. Anzahl der eindeutigen Obs durch Variable in einer Datentabelle
- 23. Concatenate mysql Spaltenwerte in PHP
- 24. AWK NULL-Spaltenwerte mit Spaltenwerte der vorherigen Reihe ersetzen
- 25. Verfolgen der eindeutigen Besucher auf einer Seite mit PHP
- 26. Excel - Anzahl der eindeutigen Werte basierend auf zwei Spalten zurückgeben
- 27. SQL Anzahl der eindeutigen Zeilen für jeden Wert
- 28. Führen Sie einen Modulus in einer großen Anzahl aus?
- 29. Speichern einer großen Anzahl von Bildern Datenbank oder Dateisystem
- 30. Hazelcast Liste der Spaltenwerte
Wie @plsnoban erwähnt zu erhöhen, diese großen Dateien verarbeitet wird (von der Art der Größe) lange dauern, – salomonderossi