Wie unutbu sagt, sollten Sie das json-Modul verwenden. Ihre Beispieldaten verwenden, kann ich dies tun:
import json
import codecs
tweet = codecs.open('example.txt', encoding='utf8').read()
data = json.loads(tweet)
print keys(data)
Mit diesem Ergebnis:
[u'favorited', u'in_reply_to_user_id', u'retweeted_status', u'contributors', u'truncated', u'entities', u'text', u'created_at', u'retweeted', u'in_reply_to_status_id', u'coordinates', u'id', u'source', u'in_reply_to_status_id_str', u'in_reply_to_screen_name', u'id_str', u'place', u'retweet_count', u'geo', u'in_reply_to_user_id_str', u'user']
keine Fehlermeldungen. Vielleicht könnten Sie einige Beispieldaten für den Fehlerfall zusammen mit dem entsprechenden Code hinzufügen?
Vielen Dank! Haben Sie eine Idee, warum es mir geben würde: ValueError: Nicht abgeschlossene Zeichenfolge ab: Zeile 1 Spalte 1403 (Char 1403)? Das passiert bei mehreren Tweets - ich weiß einfach nicht, was genau das verursacht. – Andrew
@Andrew: Poste den Text ab 1402. –
Könntest du mir bitte erklären, wie man das leicht macht? – Andrew