Ich habe gelesen, answer möglicherweise als die beste Möglichkeit, eine Liste von Zeichenfolgen in Python randomisieren. Ich frage mich nur dann, wenn dies der effizienteste Weg ist, es zu tun, weil ich eine Liste von rund 30 Millionen Elementen über den folgenden Code habe:Zufällige Liste von Millionen von Elementen in Python Effizient
import json
from sets import Set
from random import shuffle
a = []
for i in range(0,193):
json_data = open("C:/Twitter/user/user_" + str(i) + ".json")
data = json.load(json_data)
for j in range(0,len(data)):
a.append(data[j]['su'])
new = list(Set(a))
print "Cleaned length is: " + str(len(new))
## Take Cleaned List and Randomize it for Analysis
shuffle(new)
Wenn es eine effizientere Art und Weise ist, es zu tun, ich Ich schätze jeden Rat, wie es gemacht wird.
Danke,
Danke für den Ratschlag, wie werden Itervalues funktionieren, da ich dachte, Daten sind eine Liste? Und kein Diktat - das scheint auch das Problem zu sein, wenn ich es ausführe: "AttributeError: 'list' Objekt hat kein Attribut 'itervalues'' – eWizardII
Er meinte,' a.update (d ['su'] für d in Daten) Die Methode '.itervalues' ist für Wörterbücher gedacht. Grundsätzlich gibt es keinen Grund für Sie, "Bereich" hier zu verwenden. – milkypostman