Ich habe einen Datensatz mit 36k Zeilen. Ich möchte 9k Zeilen mit Pandas nach dem Zufallsprinzip auswählen. Wie beende ich diese Aufgabe?Wie wählt man zufällig Reihen aus einem Datensatz mit Pandas?
2
A
Antwort
4
ich glaube, Sie sample
verwenden können - 9k
oder 25%
Reihen:
df.sample(n=9000)
Oder:
df.sample(frac=0.25)
Eine andere Lösung mit der Erstellung Stichprobe von index
von numpy.random.choice
und wählen Sie dann durch loc
-index
hat einzigartig sein:
df = df.loc[np.random.choice(df.index, size=9000)]
Lösung, wenn nicht eindeutiger Index:
df = df.iloc[np.random.choice(np.arange(len(df)), size=9000)]
2
numpy
i = np.random.permutation(np.arange(len(df)))
idx = i[:9000]
pd.DataFrame(df.values[idx], df.index[idx])
Verwandte Themen
- 1. Wie wählt man zufällig Elemente aus einem Array?
- 2. Wie wählt man zufällig einige Pandas Datenrahmen Zeilen?
- 3. Wie wählt man zufällig ein Tupel aus einer Liste?
- 4. Wie wählt man zufällig zwischen zwei Zahlen aus?
- 5. Wie wählt man die Taste zufällig Selen
- 6. Wie wählt man zufällig einen Gegenstand aus einem Array mit 1000 Gegenständen?
- 7. Wie wählt man stündliche Werte aus dem Datensatz?
- 8. Wie subtrahiert man Reihen eines Pandas-Datenrahmens von einem anderen?
- 9. Wie wählt man Spalten aus groupby Objekt in Pandas?
- 10. ArrayList wählt zufällig
- 11. Wie plottet man mehrere Reihen auf Pandas?
- 12. Wie wählt man alle Datensätze mit einem Anhang aus?
- 13. Spark-Datensatz wählt mit typedcolumn
- 14. Python Pandas Wie wählt man Zeilen mit einem oder mehreren Nullen aus einem DataFrame aus, ohne Spalten explizit aufzulisten?
- 15. Wie wählt man Dinge in einem Element wie diesem aus?
- 16. Wie filtert man Daten aus einem Datensatz aus?
- 17. Pandas wählt eine Reihe von Spalten aus einem Datenrahmen
- 18. Wie mit Pandas Listen innerhalb Reihen speichern
- 19. Wie man einen Schlüssel aus einem Wörterbuch zufällig auswählt
- 20. Wie wählt man zwei zufällige Elemente aus einem Set?
- 21. Wie wählt man Zeilen aus einem 3D-Tensor in TensorFlow?
- 22. Iterate durch Pandas Reihen effizient
- 23. Wie wählt man sichtbare Elemente in einem Container aus?
- 24. Wie wählt man Bilder zufällig aus und geht in eine andere leere Liste?
- 25. Wie wählt man zufällig eine Zeichenfolge aus einer Liste und fügt sie in eine neue ein?
- 26. Pandas Zugriff Reihen - Python3
- 27. Wie wählt man nur bestimmte Attribute aus einem Modell?
- 28. Wie wählt man Datum aus einem Zeitbereich in PostgreSQL?
- 29. Wie wählt man Daten aus verbundenen Tabellen als Tabellentyp aus?
- 30. Wie wählt man Pandas? Die Werte beginnen mit einem bestimmten Text?
Ich bin Überlauf zu stapeln. Ich werde das machen. Ich habe auf den Pfeil nach oben geklickt. ich hoffe du hast den upvote bekommen :-) –
Danke .. du hast es richtig gemacht ;-) – piRSquared
Wirklich ein Betrogener davon: http: //stackoverflow.com/questions/15923826/random-row-selection-in-pandas-dataframe Siehe letzte Antwort – EdChum