Ich habe eine Datei mit InhaltWie kann ich den Inhalt einer Datei nach dem Zufallsprinzip abtasten?
abc
def
high
lmn
...
...
Es gibt mehr als 2 Millionen Zeilen in den Dateien. Ich möchte Zeilen zufällig aus den Dateien abtasten und 50K Zeilen ausgeben. Irgendwelche Gedanken darüber, wie man dieses Problem angeht? Ich dachte entlang der Linien von Perl und seiner rand
Funktion (Oder ein handlicher Shell-Befehl wäre ordentlich).
Verwandte (Möglicherweise Duplizieren) Fragen:
- Randomly Pick Lines From a File Without Slurping It With Unix
- How can I get exactly n random lines from a file with Perl?
Ist die Anzahl der Zeilen, die Sie ausgeben möchten, genau oder ist es in Ordnung, dass der Algorithmus etwa 2,5% aller Zeilen ausgibt? –