Ich habe eine RDD mit 15 Feldern. Um etwas zu berechnen, muss ich es in Pandas Dataframe umwandeln.Convert Spark rdd zu Pandas Datenrahmen
Ich versuchte mit df.toPandas() -Funktion, die nicht funktionierte. Ich habe versucht, jedes rdd zu extrahieren und es mit einem Leerzeichen zu trennen und es in einen Datenrahmen zu stellen, der auch nicht funktionierte.
[u'2015-07-22T09:00:28.019143Z ssh 123.242.248.130:54635 10.0.6.158:80 0.000022 0.026109 0.00002 200 200 0 699 "GET https://google.coml HTTP/1.1" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.130 Safari/537.36" ECDE-PAM TLSv1.2',
u'2015-07-22T09:00:27.894580Z ssh 203.91.211.44:51402 10.0.4.150:80 0.000024 0.15334 0.000026 200 200 0 1497 "GET https://yahoo.com HTTP/1.1" "Mozilla/5.0 (Windows NT 6.1; rv:39.0) Gecko/20100101 Firefox/39.0" ECDL-RAT TLSv1.2']
Gibt es eine Funktion, die ich verwenden kann?
Vielen Dank im Voraus!