2017-12-12 1 views
-1

Ich bin über Zeilen einer csv-Datei iterieren, ich möchte die Zeile aus der Verarbeitung überspringen, wenn es aus einer der früheren verarbeiteten Zeile dupliziert ist.Identifizieren duplicate - csv dict reader

Unten ist mein Code:

import csv 
csv_contents = request.vars['file'].value.decode('utf-8') 
file = csv_contents.splitlines() 
file_data = [row for row in csv.DictReader(file)] 
for data in file_data: 
    #if duplicate, continue. skip the row 

Wie zu erkennen, ob eine Zeile in einer Datei Duplikat ist.

+0

Wenn Sie eine CSV-Datei mit einem DictReader lesen, ist es strukturiert. Gibt es einen * Schlüssel * im Datensatz oder müssen Sie die vollständige Zeile vergleichen? –

+0

@SergeBallesta müssen die vollständige Zeile vergleichen. –

Antwort

0

Um die doppelten Einträge aus einer Liste zu entfernen, können Sie die Liste in einen Satz konvertieren und erneut in eine Liste konvertieren.

Wie Serge Ballesta sagte die Liste Reihenfolge wird nicht mit dieser Methode gespeichert.

+1

Wenn die Reihenfolge zählt, haben Sie verloren ... –