Betrachten Sie folgenden CodeEffiziente Aufteilung von Daten in Python
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
Was ich versuche, in diesem Code zufällig in Sales
Sframe meine Daten aufgeteilt in etwa 4 gleiche Teile (die Pandas Datenrahmen ähnlich ist).
Was ist ein Pythonic/Efficient Weg, dies zu erreichen?
Können Sie erklären, warum dies nicht Pythonic oder effizient wie geschrieben ist? Ein Problem, das ich sehen kann, ist das Erstellen einer Reihe von Falten, die keine Zweierpotenz sind, aber das klingt anders als das, was Sie fragen. – papayawarrior