Ich versuche, eine CSV zu einem RDD (SPARK) mit Python zu lesen. Das Problem, das ich habe, ist während der Verwendung der Split-Funktion mit Komma als Trennzeichen. Dies funktioniert, solange in jeder Spalte kein Komma vorhanden ist. Wenn Kommas vorhanden sind, teilt das Komma jede Spalte in mehrere Spalten auf.Escape-Komma beim Lesen mit sc.textFile (APACHE SPARK RDD)
z.B.
empid, emp Titel, emp ab, uni 123, Entwickler, die Rolle des Entwicklers Software mit Sprachen wie C zu entwickeln, C++ usw., college1
data = sc.textfile("files.csv")
empid, emp title, emp desc, college = line.strip().split(",")
in dem obigen Beispiel der emp ab ist auch auf die Hochschule verteilt, bitte lassen Sie mich wissen, wie man mit Kommas in jeder Spalte umgehen, während Sie den Datensatz lesen?