Ich möchte eine TXT-Datei nehmen, die in folgendem Format ist:eine TXT-Datei in Pandas Formatierung
StateOne[edit]
RegionOne (UniversityOne)[1]
RegionTwo (UniversityTwo)
RegionThree (UniversityThree)[2]
werden und haben diese Daten gereinigt und in einem Datenrahmen dieses Format zurückgegeben:
State RegionName
0 StateOne RegionOne
1 StateOne RegionTwo
2 StateOne RegionThree
so zum Beispiel habe ich:
Alabama[edit]
Auburn (Auburn University)[1]
Florence (University of North Alabama)
Jacksonville (Jacksonville State University)[2]
und ich brauche diese in den Datenrahmen zu konvertieren:
State RegionName
0 Alabama Auburn
1 Alabama Florence
2 Alabama Jacksonville
Ich bin ein wenig verwirrt, wie die Zeichen wie "["
bis zum Ende zu entfernen und haben sie "State"
benannt werden. Und für "RegionName"
, wenn Sie jedes Zeichen von entfernen, um bei Bedarf zu beenden. Ziemlich neu bei Pandas und verwirrt über einen schnellen einfachen Weg, dies zu tun.
es in der Regel hilft Ihnen, Antworten zu bekommen, wenn Sie zumindest versucht haben, und zeigen Sie, dass – dartdog
Vielen Dank für den Rat. Ich bin neu zu Stack-Überlauf, so dass ich hier die Regeln lerne. Ich versuchte eine 'str.split()' Methode aber es schien nicht die Ergebnisse zu bekommen, die ich wollte – kma