Ich habe eine CSV-Datei mit einer der Spalten mit Wert in Anführungszeichen eingeschlossen. Diese Spalte enthält auch Kommas. Wie lese ich diese Art von Spalten in CSV in Spark mit Scala in eine RDD. In Anführungszeichen eingeschlossene Spaltenwerte sollten als Integer-Typ gelesen werden, da sie Werte wie Total Assets, Total Debts sind.Lesen Sie eine CSV-Datei mit, wie Trennzeichen und numerische Daten auch enthalten, Trennzeichen zum Erstellen RDD in Spark mit Scala
Beispiel Datensätze aus csv ist
Jennifer,7/1/2000,0,,0,,151,11,8,"25,950,816","5,527,524",51,45,45,45,48,50,2,,
John,7/1/2003,0,,"200,000",0,151,25,8,"28,255,719","6,289,723",48,46,46,46,48,50,2,"4,766,127,272",169
Ich habe versucht {val result = input.map (x => x.split (","))}. Es nimmt "25 als eine Spalte Wert und 950 als eine andere Spalte Wert aus der ersten Zeile. Aber konnte nicht mehr Ideen bekommen. – ibh