ich einen Eingang csv-like-Datei wie folgt aussehen:csv-like Eingabetext zu JSON-String
"2017-06-01T01:01:01Z";"{\"name\":\"aaa\",\"properties\":{"\"propA\":\"some value\",\"propB\":\"other value\"}}"
"2017-06-01T01:01:01Z";"{\"name\":\"bbb\",\"properties\":{"\"propB\":\"some value\","\"propC\":\"some value\",\"propD\":\"other value\"}}"
I json Zeichenfolge wie diese erhalten möchten, so dass ich Datenrahmen aus Glatt- oder JSON-String erstellen:
[{
"createdTime": "...",
"value":{
"name":"...",
"properties": {
"propA":"...",
"propB":"..."
}
}
},{
"createdTime": "...",
"value":{
"name":"...",
"properties": {
"propB":"...",
"propC":"...",
"propD":"..."
}
}
}]
Es ist semi-strukturierte Daten. Einige Zeilen haben möglicherweise die Eigenschaft A, aber die anderen.
Wie kann ich dies in Spark mit Scalar tun?