Ich habe versucht, die Datei von der Yelp Dataset Herausforderung Website zu öffnen (https://www.yelp.com/dataset_challenge). Ich habe das erfolgreich gemacht, aber ich kann die Datei nicht öffnen, da sie keine Erweiterung hat. Es ist ungefähr 4 GB. Ich dachte, es könnte eine JSON-Datei gewesen sein, denn wenn ich in der Vergangenheit gesucht habe, war es das. Ich kann jedoch nicht herausfinden, wie man das öffnet oder es in CSV konvertiert. Ich würde gerne eine Analyse mit Python für diese Daten verwenden. Kann mir jemand helfen? Vielen Dank.Yelp Dateityp
Antwort
Ich hatte das gleiche Problem. Es stellt sich heraus, dass die Datei im tar (die ohne die Erweiterung) auch eine TAR-Datei ist - also ist der Download im Grunde eine TAR-Datei in einer TAR-Datei. Fügen Sie nach dem Extrahieren der ursprünglichen Datei die tar-Erweiterung hinzu und extrahieren Sie sie anschließend. Nach dem Extrahieren haben Sie alle verschiedenen JSON-Dateien für den Datensatz.
Das github-Projekt für Yelp-Dataset-Beispiele enthält einige Beispiele. Einer davon ist "json_to_csv_converter", der Ihnen dabei helfen soll, das zu tun, was Sie verlangen.
Yelp's Academic Dataset Examples
Lassen Sie mich wissen, ob das hilft!
Ich sah mir das an, aber ich hatte den Eindruck, dass es eine JSON-Datei sein musste. Ich werde es versuchen und ich werde sehen, ob das funktioniert. Vielen Dank. –
von dem, was ich den Download sagen kann, ist eine TAR-Datei (komprimiert wie ein ZIP-Ordner). Möglicherweise müssen Sie den Inhalt extrahieren, bevor Sie die Datasets anzeigen können. Stellen Sie sicher, dass auf Ihrem Computer alle Dateierweiterungen angezeigt werden. Ich habe mir die Daten nicht selbst angesehen, aber es klingt so, als hätte sie eine Erweiterung, die einfach nicht auf Ihrem Computer angezeigt wird. Ich könnte falsch liegen, aber das ist mein Bauchgefühl. –
Ich habe 7-zip verwendet, um es zu extrahieren. Ich bin mir nicht sicher, ob das das richtige Werkzeug ist oder nicht. Es schien zu funktionieren, aber dann kam die Datei ohne Erweiterung heraus. Ich wollte versuchen, den Inhalt in einer Art Klartext anzuzeigen, aber die Datei ist zu groß. Wenn ich es in einer IDE wie pycharm öffne, fragt es, um welche Art von Datei es sich handelt, und wenn ich Text oder JSON auswähle, wird es immer noch mit einer Menge seltsamer Zeichen angezeigt. Danke für Ihre Antwort. –
- 1. Yelp Yelp Datensatz
- 2. lesen yelp api Antwort
- 3. Ionic 2 Yelp API
- 4. angular yelp api ungültiger Signaturfehler
- 5. Falsche Anfrage von Yelp API
- 6. Fehler mit Yelp API Ausgang
- 7. abrufen yelp Kategorien und Unterkategorien
- 8. C# - Formatierung von Yelp API-Ausgabe
- 9. Yelp, Googles API für Restaurants Hilfe
- 10. JSONP Fehler für Yelp Fusion API
- 11. Wie man Yelp API Anfrage machen?
- 12. Zugriff auf Yelp-API in PHP
- 13. Android Yelp wie Suchleiste in ActionBar
- 14. Yelp zurück 200 aber Fehler mit $ http
- 15. Prüfe Dateityp in Dropzone
- 16. MSdeploy überspringt bestimmten Dateityp
- 17. Wie Dateityp einer Datei
- 18. Protege Dateityp Einschränkung
- 19. NSOpenPanel - Dateityp festlegen?
- 20. NSData Dateityp Validierung
- 21. Forbidden Dateityp docx
- 22. Regex Matching Dateityp
- 23. Adobe Brackets + jQuery Dateityp
- 24. Benutzerdefinierter Dateityp und Symbol
- 25. PhpStorm Forcing Dateityp
- 26. Überprüfen NSURL für UTI/Dateityp
- 27. Benutzerdefinierte Dateityp in Android nicht
- 28. PHP Excel creation - ungültige Dateityp
- 29. Welcher Dateityp gibt MediaStore.ACTION_VIDEO_CAPTURE zurück?
- 30. Netbeans fehlt Dateityp | Kategorie | Andere
Wow! Das hat funktioniert! Vielen Dank. Ich habe das als Antwort akzeptiert. Das funktioniert perfekt. Danke nochmal. –