Die Daten im Dataset bestehen ausschließlich aus Zeichen. Zum Beispiel:Plotten eines Pandas DataFrame von Char-Daten mit matplotlib
p,x,s,n,t,p,f,c,n,k,e,e,s,s,w,w,p,w,o,p,k,s,u
e,x,s,y,t,a,f,c,b,k,e,c,s,s,w,w,p,w,o,p,n,n,g
e,b,s,w,t,l,f,c,b,n,e,c,s,s,w,w,p,w,o,p,n,n,m
p,x,y,w,t,p,f,c,n,n,e,e,s,s,w,w,p,w,o,p,k,s,u
e,x,s,g,f,n,f,w,b,k,t,e,s,s,w,w,p,w,o,e,n,a,g
Eine vollständige Kopie der Daten kann in agaricus-lepiota.data in the uci machine learning datasets mushroom dataset
Gibt es Methoden der Visualisierung für die Verwendung von char-Daten (anstatt konvertieren die Daten auf numerisch) über matplotlib gefunden werden?
Nur für jede Art von Visualisierungen heißt:
filename = 'mushrooms.csv'
df_mushrooms = pd.read_csv(filename, names = ["Classes", "Cap-Shape", "Cap-Surface", "Cap-Colour", "Bruises", "Odor", "Gill-Attachment", "Gill-Spacing", "Gill-Size", "Gill-Colour", "Stalk-Shape", "Stalk-Root", "Stalk-Surface-Above-Ring", "Stalk-Surface-Below-Ring", "Stalk-Colour-Above-Ring", "Stalk-Colour-Below-Ring", "Veil-Type", "Veil-Colour", "Ring-Number", "Ring-Type", "Spore-Print-Colour", "Population", "Habitat"])
#If there are any entires (rows) with any missing values/NaN's drop the row.
df_mushrooms.dropna(axis = 0, how = 'any', inplace = True)
df_mushrooms.plot.scatter(x = 'Classes', y = 'Cap-Shape')
Ich glaube nicht. Es ist eine große Frage, was die Charaktere darstellen. Glücklicherweise ist die Konvertierung zu Zahlen einfach. –
Es gibt eine 'pd.factorize' Methode, die Sie verwenden können. Alternativ können Sie auch in kategorisch konvertieren. –
Im Prinzip können Sie etwas wie 'plt.scatter (["e", "w", "a", "e"], ["z", "t", "z", "u"]) '' tun . Ich bin mir nicht sicher, ob Sie danach suchen, zumal im Fall von Pilzen, was wäre die Information, die eine solche Handlung vermittelt? Möchtest du nicht lieber wissen, wie viele braune Pilze essbar sind oder wo die Menge von Interesse ist? Eine Streuung würde nur einen Punkt zeigen, egal wie oft diese Kombination in den Daten ist. – ImportanceOfBeingErnest