Ich versuche, Daten aus einer JSON-Datei in R zu importieren, um mit der Verarbeitung natürlicher Sprache zu experimentieren. Die Daten wurden analysiert und aus einem Blog extrahiert, der in Markdown geschrieben wurde. Das Problem ist, dass der Import in R als Listen und ein lustiges Format importiert wird, und ich kann nicht herausfinden, wie man es in einen Datenrahmen bringt. Ist es ein Problem mit meiner JSON-Datei oder meinem Importprozess?Importieren von JSON-Dateidaten in R als Datenrahmen für NLP
Beispieldaten:
{
"2017-11-17-blog-post-01": {
"title": "Blog Post 01",
"layout": "post",
"categories": [
"Category1",
"Category2"
],
"comments": true,
"published": true,
"permalink": "/blog-post-01.html",
"basename": "2017-11-17-blog-post-01"
},
"2017-11-30-blog-post-02": {
"title": "Blog Post 2",
"layout": "post",
"categories": [
"Category2",
"Category3"
],
"comments": true,
"published": true,
"permalink": "/2017-11-30-blog-post-02.html",
"basename": "2017-11-30-blog-post-02"
}
}
Befehl:
library(jsonlite)
import <- fromJSON("test-import.json", flatten=TRUE)
Ergebnisse:
$`2017-11-17-blog-post-01`
$`2017-11-17-blog-post-01`$title
[1] "Blog Post 01"
$`2017-11-17-blog-post-01`$layout
[1] "post"
$`2017-11-17-blog-post-01`$categories
[1] "Category1" "Category2"
$`2017-11-17-blog-post-01`$comments
[1] TRUE
$`2017-11-17-blog-post-01`$published
[1] TRUE
$`2017-11-17-blog-post-01`$permalink
[1] "/blog-post-01.html"
$`2017-11-17-blog-post-01`$basename
[1] "2017-11-17-blog-post-01"
$`2017-11-30-blog-post-02`
$`2017-11-30-blog-post-02`$title
[1] "Blog Post 2"
$`2017-11-30-blog-post-02`$layout
[1] "post"
$`2017-11-30-blog-post-02`$categories
[1] "Category2" "Category3"
$`2017-11-30-blog-post-02`$comments
[1] TRUE
$`2017-11-30-blog-post-02`$published
[1] TRUE
$`2017-11-30-blog-post-02`$permalink
[1] "/2017-11-30-blog-post-02.html"
$`2017-11-30-blog-post-02`$basename
[1] "2017-11-30-blog-post-02"
Das Ergebnis wird ‚als erwartet‘ gegeben das JSON-Format. Wenn Sie sagen, dass Sie ein 'dat.frame' möchten, wie soll das data.frame aussehen? – SymbolixAU
Also, was ist das Problem mit dem JSON-Format? Ich denke, ich erwarte, dass der Datenrahmen mehrere "Spalten" ist, so dass ich ein paar Prozesse über die Daten ausführen kann, um Keywords herauszuziehen und einige NLP-Dinge auszuprobieren. Vielen Dank! – markwk