Dies ist eine Teilmenge eines Datenrahmens zu schaffen:einen neuen Datenrahmen unter Verwendung von Differenzen zwischen zwei Spalten in Pandas
index id drug sentences SS1 SS2
1 2 lex very bad 0 1
2 3 gym very nice 1 1
3 7 effex hard 1 0
4 8 cymba poor 1 1
Ich mag Zeilen finden, die SS1 und SS2 sind unterschiedlich und erstellen Sie einen neuen Datenrahmen darauf bezogen. Die Ausgabe sollte so sein:
index id drug sentences SS1 SS2
1 2 lex very bad 0 1
3 7 effex hard 1 0
Dies ist mein Code:
df [['index','id', 'drug', 'sentences', 'SS1', 'SS2' ]] = np.where(df.SS1 != df.SS2)
Aber es hat den folgenden Fehler: ValueError: Must have equal len keys and value when setting with an ndarray
Jeder Vorschlag?
@ Open-Source bereits gab eine funktionierende Alternative, sondern nur als Referenz , Sie haben einen 'ValueError', weil' np.where (df.SS1! = df.SS2) 'einen Index zurückgibt, für den Ihre Auswertung gilt, nein t ein 'Datenrahmen'. – peterfields
@peterfields danke – Mary