2011-01-17 12 views

Antwort

9

Sie suchen wahrscheinlich nach dem json Modul.

Zum Beispiel

In [165]: json.loads('{"a": 0, "c": 0, "b": 0}') 
Out[165]: {u'a': 0, u'b': 0, u'c': 0} 
+0

Vielen Dank! Haben Sie eine Idee, warum es mir geben würde: ValueError: Nicht abgeschlossene Zeichenfolge ab: Zeile 1 Spalte 1403 (Char 1403)? Das passiert bei mehreren Tweets - ich weiß einfach nicht, was genau das verursacht. – Andrew

+0

@Andrew: Poste den Text ab 1402. –

+0

Könntest du mir bitte erklären, wie man das leicht macht? – Andrew

3

Wie unutbu sagt, sollten Sie das json-Modul verwenden. Ihre Beispieldaten verwenden, kann ich dies tun:

import json 
import codecs 
tweet = codecs.open('example.txt', encoding='utf8').read() 
data = json.loads(tweet) 
print keys(data) 

Mit diesem Ergebnis:

[u'favorited', u'in_reply_to_user_id', u'retweeted_status', u'contributors', u'truncated', u'entities', u'text', u'created_at', u'retweeted', u'in_reply_to_status_id', u'coordinates', u'id', u'source', u'in_reply_to_status_id_str', u'in_reply_to_screen_name', u'id_str', u'place', u'retweet_count', u'geo', u'in_reply_to_user_id_str', u'user'] 

keine Fehlermeldungen. Vielleicht könnten Sie einige Beispieldaten für den Fehlerfall zusammen mit dem entsprechenden Code hinzufügen?

Verwandte Themen