KISSmetrics generiert ungültige JSON-Zeichenfolgen, die ich parsen muss. Ich erhalte jede Menge Fehler wieUngültige JSON-Entschlüsselung beheben
ERROR 2013-03-04 04:31:12,253 Invalid \escape: line 1 column 132 (char 132): {"search engine":"Google","_n":"search engine hit","_p":"z392cpdpnm6silblq5mac8kiugq=","search terms":"happy new year animation 1920\303\2271080 hd","_t":1356390128}
ERROR 2013-03-04 04:34:19,153 Invalid \escape: line 1 column 101 (char 101): {"search engine":"Google","_n":"ad campaign hit","_p":"byskpczsw6sorbmzqi0tk1uimgw=","search terms":"\331\203\330\261\330\252\331\207 \331\201\331\212\330\257\331\212\330\244\331\211 \330\256\331\212\331\204\330\247\330\255\331\211 \331\203\331\210\330\261\330\257\331\211","_t":1356483052}
Mein Code ist:
for line in lines:
try:
data = self.clean_data(json.loads(line))
except ValueError, e:
logger.error('%s: %s' % (e.message, line))
Beispiel Rohdaten:
{"search engine":"Google","_n":"search engine hit","_p":"kvceh84hzbhywcnlivv+hdztizw=","search terms":"military sound effects programs","_t":1356034177}
Gibt es eine Möglichkeit zur Reinigung dieser unordentlichen JSON und es analysieren? Danke für Ihre Hilfe.
Wie beurteilen Sie die JSON analysieren? Was ist der 'repr()' des Wertes vor der Decodierung? –
Ah, deine Eingabedaten haben * octal * escape, es sieht so aus. Diese wären in der Tat ungültig JSON. –