2017-03-13 3 views
0

Ich habe Koeffizienten aus dem Ausführen mehrerer Regression.Anordnen mehrerer Regressionsergebnisse in Python sklearn

Ich möchte die unabhängigen Variablen als Spaltennamen anordnen und dann Koeffizienten als erste Zeile platzieren, um sehen zu können, welche unabhängige Variable welchen Koeffizienten hat.

#assigning independent variables to x 
x = df.drop("dependent var", axis = 1) 
... 
#creating a data frame with independent variables as headers 
df_coef = pd.DataFrame(columns = x.columns) 
#adding a row with a coefficients 
df.loc[0] = x 
#shifting index by 1 
df.index = df.index + 1 
#sorting by index 
df = df.sort() 

ich eine Störung erhalte:

ValueError: cannot set a row with mismatched columns 

Was mache ich falsch?

+1

In welcher Zeile erhalten Sie Fehler? Erklären Sie auch mehr darüber, was Sie tun möchten. Zeigen Sie einige Datenbeispiele an. Bitte lesen Sie http://StackOverflow.com/Help/how-to-ask –

+0

Meine Vermutung wäre, dass 'df.loc [0] = x 'den Fehler verursacht, da' x' eine Kopie des 'df' selbst ohne die "dependedn var" -Spalte (n) - also das Mismatch. Wie @VivekKumar sagte, sind dazu weitere Informationen notwendig. – mkaran

Antwort

0

Die erste Befehlszeile:

#assigning independent variables to x 
x = df.drop("dependent var", axis = 1) 

Was Sie hier tun, ist das Kopieren von Original-Datenrahmen, df, ohne die "abhängige var" Spalte. (Es war, wie durch den Befehl vorgeschlagen, fiel aus dem Datenrahmen)

Was auch immer Spalten bei df links sind als als Header zu Ihrem neuen df zugeordnet ist:

#creating a data frame with independent variables as headers 
df_coef = pd.DataFrame(columns = x.columns) 

Afterwise, Sie versuchen, eine Zeile zu Ihrem neuen df hinzuzufügen, an Indexposition 0, mit einem einzigen Wert:

#adding a row with a coefficients 
df.loc[0] = x 

Dies ist höchstwahrscheinlich, wo Ihre Fehler auftreten, wird die df höchstwahrscheinlich mehr als eine Spalte, ye t, versuchen Sie eine Zeile mit einem einzigartigen Mehrwert zu schaffen und damit die Fehlermeldung:

ValueError: cannot set a row with mismatched columns 

Sie könnten eine IDE-Code verwenden, wenn ja, ein guter Rat eine freundlichere Datenvisualisierungstool zu verwenden ist wie Anaconda/Jupyter Notebook. Damit können Sie Daten Schritt für Schritt visualisieren, um den ersten Fehler zu vermeiden.

Hoffen, dass hilft,