Say I Textdatei wie unten haben:Import Textdatei mit ungleichen Spaltennummer und komplizierte Trennzeichen
apple pear banana, peach orange grape
dog cat white horse
salmon
tiger lion eagle hawk monkey
für die Ausgabe der Suche wie:
"apple", "pear", "banana", "peach orange grape"
"dog", "cat", "white horse"
"salmon"
"tiger", "lion", "eagle hawk", "monkey"
Zwei Probleme,
- jedes Zeile Ich möchte sie nur durch doppelten Platz trennen ''
- Spaltennummer von e ach Reihe könnte zufällig sein, von 1 bis 100
Wie kann ich sie in einen Pandas Datenrahmen laden?
Tatsächlich frage ich mich, ob es möglich ist, dies zu vollenden, ohne Zeile für Zeile zu lesen, weil ich Anfangs-Lösung ist:
jede Zeile lesen, verwendet REX
re.split (r '\ s {2,}', Zeile)
aufzuspalten durch Doppel Raum
- nach Spaltung durch Doppelraum, legen jede Zeile in DF
jedoch Coz die Spaltennummer zufällig ist, kann ich nicht einfach eine DF erzeugen, indem sie das. Das Hinzufügen von Namen = [] in pd.read_csv() behandelt ungleiche Spalten, erfordert jedoch vordefinierte Spaltennamen und -nummern.
Irgendwelche Vorschläge?
Vielen Dank!
Oh großer Jan! In der Tat war meine ursprüngliche Lösung sehr ähnlich, aber ich habe nicht pd.DataFrame.from_records() verwendet, die ungleiche Spalten ignorieren könnte! Danke vielmals! – Windtalker
@Windtalker: Ich bin froh zu helfen. – Jan