Ich bin neu bei Python und Pandas und spiele mit einem Herzkrankheitsdatensatz über UCI. https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.dataPandas Datenrahmen umformen: Neue Zeile für je 76 Einträge
Es gibt 76 Attribute für jede Person und 303 Leute, also möchte ich mit jeder Person als eine Reihe und 76 Spalten enden. Ich habe Probleme, dies in einen Datenrahmen zu arrangieren, weil die Daten in Zeilen von 9 dargestellt werden.
Ich habe versucht, das Dataset in einen Pandas Datenrahmen mit einem Leerzeichen oder einem Zeilenumbruch als Trennzeichen zu importieren, aber ich bin es noch nicht in der Lage, die Daten zu verhindern, wollen alle 8 Werte teilen:
df = pd.read_table('https://archive.ics.uci.edu/ml/machine-learning-databases/heart-disease/hungarian.data', sep=' ')
df Ergebnisse in einer Tabelle wie folgt aus:
1254 0 40 1 1.1 0.1 0.2
-9.0 2 140.0 0.0 289 -9.0 -9.0 -9.0
0.0 -9 -9.0 0.0 12 16.0 84.0 0.0
0.0 0 0.0 0.0 150 18.0 -9.0 7.0
172.0 86 200.0 110.0 140 86.0 0.0 0.0
0.0 -9 26.0 20.0 -9 -9.0 -9.0 -9.0
ich irgendwelche Ratschläge zu schätzen wissen würde haben Sie vielleicht, wie man Teilen Sie dies auf und erstellen Sie eine neue Zeile danach immer 76. Wert. Jeder 76. Wert ist die Zeichenfolge 'name' und dies bezeichnet das Ende der Daten einer Person. Vielen Dank!
Es ist machbar, aber schmerzhafte Datenrahmen rubikscubing. Da die Eingabedatei nicht so groß ist, würde ich an der Eingabe-Zeichenfolge arbeiten und \ n und name ersetzen, um ausgerichtete Zeilen zu bekommen, die read_table bedienen – Boud