Ich habe eine Format- in folgenden CSV-Datei sortiertAnfügen fehlende Werte in eine CSV-Datei
X,Y
0,0
0,1
0,2
1,0
1,1
2,0
2,1
2,1
Hier wird ein Wert 1,2
fehlt. Dies ist nur ein Beispiel, meine Datei enthält 1 Million Datensätze mit ein paar Tausend abwesend. Wie kann ich ein Skript schreiben, um diese Werte zu erkennen und an die Datei anzuhängen?
Ich habe versucht, alle möglichen Paare zu erzeugen und prüfen, ob sie in der Datei vorhanden sind oder nicht, ist aber viel zu langsam-
import csv
with open('myfile.csv') as csvfile:
r = csv.reader(csvfile, delimiter=',')
for row in r:
for i in range(1000):
for j in range(1000):
if (int(row[0]) == i and int(row[1]) == j):
# Can perform operations here
Gibt es irgendeine Weise, die ich Numpy oder Pandas können (ich bin sehr neu, um dieses Problem zu lösen?
Ist es für einige wissenschaftliche Gründe? Ansonsten, warum nicht einfach alle möglichen Paare generieren und in die Datei schreiben, anstatt nach fehlenden zu suchen? –
Tatsächlich gibt es eine zusätzliche Spalte mit einem Zählwert für jeden Datensatz. – amadispstac