Ich habe eine Xlsx-Datei mit über 1000 Datenspalten. Ich möchte zuerst jede zweite Spalte aus der Datendatei analysieren (die Zahlen und Buchstaben enthalten kann) und dann eine eindeutige Liste aus den geparsten Daten erstellen.Erstellen einer eindeutigen Liste mit Pandas
Ich bin ein komplettes noob & habe versucht, eine "für" und "tun, während" Schleife, aber keiner hat für mich gearbeitet.
Bisher habe ich:
import pandas as pd
workbook = pd.read_excel('C:\Python27\Scripts\Data.xlsx')
worksheet = workbook.sheetname='Data'
for col in range(worksheet[0], worksheet[1300]):
print(col)
Ich glaube, ich brauche die Daten anhängen und vielleicht in eine Textdatei schreiben dann eine eindeutige Liste aus der Textdatei erstellen - ich den zweiten Teil tun kann, es nur wird immer es in die Textdatei, mit der ich Probleme habe.
Dank
Entschuldigung, wenn Sie sagen, dass jede zweite Spalte nur eine zweite Spalte oder eine gerade Spalte bedeutet? Wünschen Sie auch eine globale Liste oder eine Liste pro Spalte? Haben Sie sich auch ['unique'] angesehen (http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html#pandas.Series.unique)? – EdChum
Dank Ed, es ist jede gerade Spalte - 0,2,4,6,8, etc, oder A, C, E, G, ich den ganzen Weg nach AWK. Es gibt insgesamt 1286 Spalten, also würde ich gerne eine Liste von 643 erstellen und dann aus dieser Liste eine eindeutige Liste erstellen. Ich werde definitiv Pandas.series.unique() verwenden, aber ich bin mir nicht sicher, wie man die 643 Spalten in eine Liste bringt. –