Ich habe einen Pandas-Datenrahmen, wo es einige fehlende Werte gibt. Ich habe bemerkt, dass die nicht fehlenden Werte nahe beieinander liegen. Daher möchte ich die fehlenden Werte durch zufällige Auswahl der nicht fehlenden Werte imputieren.Fehlende Daten durch zufällige Auswahl von nicht fehlenden Werten in Pandas Dataform füllen
Zum Beispiel:
import pandas as pd
import random
import numpy as np
foo = pd.DataFrame({'A': [2, 3, np.nan, 5, np.nan], 'B':[np.nan, 4, 2, np.nan, 5]})
foo
A B
0 2 NaN
1 3 4
2 NaN 2
3 5 NaN
4 NaN 5
ich zum Beispiel möchte foo['A'][2]=2
und foo['A'][5]=3
Die Form meines Pandas ist Dataframe (6940,154). Ich versuche, diese
foo['A'] = foo['A'].fillna(random.choice(foo['A'].values.tolist()))
Aber es funktioniert nicht. Könntest du mir helfen, das zu erreichen? Freundliche Grüße.
Ich versuche es. Aber anstatt die Werte anzugeben, wird ' bei 0x7fa4eb48b9b0> '.. –
Entschuldigung, können Sie einige Beispieldaten zur Verfügung stellen? – bamdan
Ich habe meine Frage mit Beispieldaten bearbeitet. Danke –