Ich arbeite an einem Data Mining-Projekt. Ich muss Daten aus einem JSON-Format-Datensatz lesen, der zu Amazon gehört.
Das Format des Datensatzes ist wie folgt:
Zuerst habe ich diese Zeilen extrahieren möchten:
[Produktname], [Bewertung]
Und danach möchte ich mit zwei Spalten die Zeilen in eine CSV-Datei schreiben, benannt als productName und Rating. Gibt es eine Möglichkeit, dies mithilfe der Pandas-Bibliothek zu implementieren?Wie liest man Daten aus der JSON-Datei und konvertiert sie mit Pandas in CSV?
Antwort
Mit einer Teilmenge von Daten habe ich es in DF.Note umgewandelt, dass die Daten, die Sie haben, keine json-formatierten Daten sind.
import pandas as pd
import json
from collections import defaultdict
import re
f=open('inv.json')
text= f.readlines()
RowID=[]
result={}
for item in text:
if item.startswith("###"):
RowID=re.findall('\d+', item)
result[RowID[0]]={}
elif ":" in item:
key,value =item.split(":",1)
result[RowID[0]][key.strip()]=value.strip()
df= pd.DataFrame(result)
print df.transpose()
Abtastwerteingang
#####1
[ID]:0
[ProductId]:0
[rating]:2.0
#####2
[ID]:1
[ProductId]:2
[rating]:3.0
[fullText]:It is a good
[weburl]:http://example.org:xx
Ausgang
[ID] [ProductId] [fullText] [rating] [weburl]
1 0 0 NaN 2.0 NaN
2 1 2 It is a good 3.0 http://example.org:xx
Ich habe den von Ihnen entwickelten Code ausprobiert. Leider gibt es einen Fehler. Datei "C: \ Benutzer \ masoud \ Desktop \ Dataset \ data3 \ aa - Copy.py", Zeile 16, in
aktualisiert die Antwort, dass der Grund, warum wir erwarten, dass OP minimale Arbeitseingaben und erwartete Ausgaben in Frage haben. – Shijo
Das hat funktioniert! Danke Shiju. Du bist toll –
- 1. Pandas: Wie liest man eine CSV mit Zeilenumbrüchen in Feldern?
- 2. Wie liest man eine CSV-Datei aus der Datenbank?
- 3. Wie liest man eine CSV-Datei und konvertiert sie in Objekte in Javascript
- 4. Python. Wie liest man mehrere .csv-Dateien?
- 5. Wie liest man aus der zweiten Zeile mit CSV-Daten Konfigurationselement in Jmeter
- 6. Pandas - Wie konvertiert man R-Daten zurück in Pandas?
- 7. Wie liest man CSV in Ruby 1.8.7?
- 8. Wie liest man UTF-8-Dateien mit Pandas?
- 9. Wie liest man JSON-Dateien mit Pandas?
- 10. Wie liest man bestimmte Spalten aus Excel mit Pandas - Python
- 11. Wie liest man Daten aus der Datenbank in angularjs C#
- 12. Wie liest man Daten aus einem XML?
- 13. Python Pandas read_csv liest nur eine Zeile aus CSV-Datei
- 14. Wie konvertiert man diese Textdatei in CSV?
- 15. Wie liest man Schlüssel, Wertpaar der Textdatei mit Pandas?
- 16. Python Pandas liest nicht die erste Zeile der CSV-Datei
- 17. Wie liest man Daten aus einer POSTGRESQL-Datenbank mit DAS?
- 18. Wie liest man Daten aus der JSON-Datei?
- 19. Wie konvertiert man CSV zu XML mit Mapforce und Mule
- 20. Wie liest man .txt-Datei mit x- und y-Werten und konvertiert sie in ein Array?
- 21. wie man Textakte liest und Daten in der Arrayliste speichert
- 22. Wie konvertiert man Serien in Datenrahmen in Pandas
- 23. Wie liest man eine Folge von Tabellen aus Pandas read_html?
- 24. Wie konvertiert man JSon-Array in CSV?
- 25. Wie liest man eine Spalte von CSV als dtype Liste mit Pandas?
- 26. Wie konvertiert man eine Excel-Datei Daten in numpy Array mit Pandas?
- 27. Wie liest man tabellarisches PDF-Dokument mit Python Pandas?
- 28. Wie liest man ein CSV-Feld und konvertiert es zurück zur Verwendung?
- 29. Wie konvertiert man die Zeitzone der Werte einer Pandas-Serie
- 30. Pandas lesen csv mit mehreren Leerzeichen und analysieren Daten
Datei nicht – Backtrack
ist JSon Können Sie Probe von 'json' als Text hinzufügen? – jezrael
Überprüfen Sie auch, ob JSON gültig ist - http://jsonlint.com/ – jezrael