Angenommen, ich habe zwei CSV-Dateien, jeder von ihnen hat 100 Zeilen. Jede Zeile in zwei CSV-Dateien hat den gleichen Index und das gleiche Label. Daher können diese 100 Zeilen als Paardatensatz angezeigt werden.Mischen CSV-Datei Daten nach ihren Etiketten
Mein Zweck ist es, eine der CSV-Dateien zu mischen, um die Daten je nach ihren unterschiedlichen Labels ungepaart zu machen.
Zum Beispiel input:
1st CSV 2nd CSV label
data_1 data_1' 12
data_2 data_2' 6
... ... ...
Output:
data_1 data_2'
... ...
Weil Data_1 und Data_2' unterschiedliche Etiketten (12 bzw. 6), so werden sie als als ungepaarte Daten. Mein Zweck ist es, eine beliebige Anzahl von Daten auszuwählen, die mit data_1 unterschiedliche Bezeichnungen haben.
Gibt es irgendwelche Python-Bibliotheken oder Methoden, um es zu machen?
Es 3 Schritten: die Daten lesen mit [csv] (https://docs.python.org/ 2/library/csv.html), mische die Daten mit [random] (https://docs.python.org/2/library/random.html), schreibe die Daten mit [csv] (https: // docs. python.org/2/library/csv.html) – zvone
@zvone Wie kann man sicherstellen, dass die Daten mit verschiedenen Labels nicht verknüpft sind? – Kun
Wenn Sie es mischen, wird es ungepaart. Die Chance auf 100 Zeilen nach dem Mischen ist 1 bis 9,33e + 157 – zvone