0
Ich bin ein Parkett-Datei in einen Datenrahmen zu lesen:pyspark: ein bytearray Feld String in Datenrahmen umwandeln
my_df = sqlContext.read.parquet('hdfs://my_server/user/hive/warehouse/my_db.db/my_table')
, wenn ich tun:
my_df.head()
Ich habe:
Row(id=bytearray(b'00000000000000000000000000000000'), numcores=8, ...)
und wenn ich mache
my_df.show()
die erste Feld-ID wie folgt aussieht:
[30 30 30 30 30 3...]
Wie kann ich das bytearray Feld ändern und es als String Ausgabe zeigen machen? Vielen Dank!