Ich möchte aus einer Scala Liste oder Array zufällig auf Probe (kein RDD) kann die Probengröße wesentlich länger ist als die Länge der Liste oder Array, wie kann ich diese tun effizient? Da die Probengröße sehr groß sein kann und die Probenahme (auf verschiedenen Listen/Arrays) benötigt eine große Anzahl von Malen durchgeführt werden.Wie kann man aus einer Scala-Liste oder einem Array zufällig Stichproben ziehen?
ich für eine Spark wissen RDD können wir takeSample() verwenden, es zu tun, ist es ein Äquivalent für Scala Liste/Array?
Vielen Dank.
Zufallszahlengeneratoren sind Stateful, so dass es nicht sinnvoll für alle Listen, wie zu haben eine Funktion. Sie müssten eines selbst implementieren (es wäre auch eine lineare Zeitoperation). Für Arrays können Sie eine Zufallszahl aus den "Random" -Objekten wie folgt erhalten: 'Random.nextInt (myArray.length)' und indexieren Sie in das Array. – Felix
Ahh, nvm. Ich lese zu schnell xD – Felix
Danke Felix für deine Hilfe. – Carter