Ich habe Daten mit Komma in Fließkommazahlen importiert und ich frage mich, wie kann ich Komma in Punkt "konvertieren". Ich benutze pyspark dataframe, also habe ich das versucht:PySpark Dataframe: Komma zu Punkt
Und es funktioniert definitiv nicht. Also können wir es direkt im Dataframe von Funken ersetzen oder sollten wir in numpy Typ oder etwas anderes wechseln?
Danke!
Wie haben Sie Daten "importiert"? – errata
In Zeppelin verwende ich diese Zeile, um meine Daten zu importieren. Meine Daten sind in einer csv-Datei in hadoop: myData = spark.read.option ("Begrenzer", ";"). Option ("Header", "True"). CSV (Server + '/ Benutzer/Hadoop/dataAirpl/C6H5_C2H3/C6H5_C2H3_2016_08_01.csv '). Ich habe auch versucht, die Liste der Reader-Optionen in pyspark.sql.readwriter.DataFrameReader.option (Schlüssel, Wert) ohne Erfolg zu finden. Hier ist der [link] (https://spark.apache.org/docs/ 1.5.0/api/python/_modules/pyspark/sql/readwriter.html) des Dokuments – fjcf1
Das udf funktioniert nicht, da der Rückgabetyp der Funktion 'FloatType' ist, Sie aber keine Fließkomma-Konvertierung durchführen. Kann versuchen wie 'Lambda x: float (str (x) .replace (',', '.'))' – Pushkr