Parse JSON-Daten mit Apache Spark und Scala
Ich habe diese Art von Datei mit Daten, bei denen jede Zeile ist ein JSON-Objekt mit Ausnahme ersten Wörter (eingebundene Bild sehen). Ich möchte diese Art von Datei mit Spark und Scala analysieren. Ich habe es mit sqlContext.read.json ("Pfad zu JSON-Datei") versucht, aber es gibt mir Fehler (beschädigte Daten), weil ganze Daten kein JSON-Objekt ist. Wie analysiere ich diese JSON-Datei zum SQL-Dataframe?
Wenn Sie ungültige JSON, können Sie es nicht analysieren kann jedes Werkzeug mit –
diese ungültig ist JSON? –
Nun, die Tatsache, dass Sie nicht JSON Daten vor dem eigentlichen JSON haben, dann ja, es ist in Sparks Augen nicht gültig. Sie müssen diese Daten separat extrahieren –