Ich versuche, twitter Daten aus JSON-Datei mit Python 2,7.12 zu lesen. IchUnicodeDecodeError: 'utf8' Codec kann das Byte 0x80 in Position 3131 nicht entschlüsseln: ungültiges Startbyte
-Code verwendet wird, ist so:
import json
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def get_tweets_from_file(file_name):
tweets = []
with open(file_name, 'rw') as twitter_file:
for line in twitter_file:
if line != '\r\n':
line = line.encode('ascii', 'ignore')
tweet = json.loads(line)
if u'info' not in tweet.keys():
tweets.append(tweet)
return tweets
Ergebnis bekam ich:
Traceback (most recent call last):
File "twitter_project.py", line 100, in <module>
main()
File "twitter_project.py", line 95, in main
tweets = get_tweets_from_dir(src_dir, dest_dir)
File "twitter_project.py", line 59, in get_tweets_from_dir
new_tweets = get_tweets_from_file(file_name)
File "twitter_project.py", line 71, in get_tweets_from_file
line = line.encode('ascii', 'ignore')
UnicodeDecodeError: 'utf8' codec can't decode byte 0x80 in position 3131: invalid start byte
Ich ging durch alle Antworten von ähnlichen Problemen und kam mit diesem Code und es funktionierte beim letzten Mal. Ich habe keine Ahnung, warum es jetzt nicht funktioniert ... Ich würde jede Hilfe schätzen!
Danke !!! Ich habe gerade versucht, aber es funktioniert nicht - ich versuche, "Windows-1252" zu ersetzen, wie ich Mac verwende. Ich habe 'latin-1' usw. versucht. Oder spielt es keine Rolle ...? Danke für die detaillierte Erklärung ... – wannabhappy
Was ist der Fehler, den Sie jetzt haben? –
Code läuft, aber ich bekomme "NULL" für alle Variablen in der Datenbank. Wenn ich jede JSON-Datei geöffnet und überprüft habe, gibt es Tweets in der Datei. Außerdem, als ich fragte, um die Anzahl der Tweets zu drucken, heißt es, ich habe 0 Tweets .... – wannabhappy