Ich habe den folgenden Code, wo I die Pandas verwenden random_stateWas genau macht der Pandas random_state?
randomState = 123
sampleSize = 750
df = pd.read_csv(filePath, delim_whitespace=True)
df_s = df.sample(n=sampleSize, random_state=randomState)
Dies erzeugt eine Probe df_s
Datenrahmen. Jedes Mal, wenn ich den Code mit der gleichen randomState
starte, bekomme ich die gleiche Probe df_s
. Wenn ich den Wert von 123
zu 12
ändere, ändert sich auch das Beispiel, also denke ich, dass das random_state
tut.
Meine dumme Frage: Wie wirkt sich die Nummernänderung auf den Probenwechsel aus? Ich las die Pandas documentation und die Numpy documentation, konnte aber kein klares Bild bekommen.
Jede direkte Erklärung mit einem Beispiel wird sehr geschätzt.
https://stackoverflow.com/q/21494489/2285236 – ayhan