2016-09-12 4 views
0

Ich bin ein Parkett-Datei in einen Datenrahmen zu lesen:pyspark: ein bytearray Feld String in Datenrahmen umwandeln

my_df = sqlContext.read.parquet('hdfs://my_server/user/hive/warehouse/my_db.db/my_table') 

, wenn ich tun:

my_df.head() 

Ich habe:

Row(id=bytearray(b'00000000000000000000000000000000'), numcores=8, ...) 

und wenn ich mache

my_df.show() 

die erste Feld-ID wie folgt aussieht:

[30 30 30 30 30 3...] 

Wie kann ich das bytearray Feld ändern und es als String Ausgabe zeigen machen? Vielen Dank!

Antwort

0

Wenn Sie head() wieder zu Ihnen zu ändern bedeuten, was, das passiert nicht gonna, da die prototype bietet keine solche Funktionalität:

Kopf (n = None)