So habe ich diese CSV-Datei, die zwei Spalten hat: ID (Int), Name (String). Wenn ich die Datei in pyspark lesen Throught den folgenden Code:String-Codierung Problem in Spark SQL/DataFrame
schema = StructType([
StructField("id", IntegerType(), True),
StructField("name", StringType(), True)])
df = sqlContext.read.csv("file.csv",
header=False, schema = schema)
Auf Ausführung df.first()
ich folgende Ausgabe:
1240105,André Visior
:
Row(artistid=1240105, artistname=u'Andr\xe9 Visior')
die ursprüngliche Zeile aus der Datei Dies ist
Wie gehe ich vor, um den Namen so anzuzeigen, wie er ist?
Sorry, ich sollte geklärt haben. Ich möchte, dass alle Strings in der Spalte Name so sind, wie sie in der Datei sind, nicht nur die erste Zeile – HMK