Ich benutze Funke 2.1 und versuchte, CSV-Datei zu lesen.Spark - CSV lesen Option
compile group: 'org.scala-lang', name: 'scala-library', version: '2.11.1' compile group: 'org.apache.spark', name: 'spark-core_2.11', version: '2.1.0'
Hier ist mein Code.
import java.io.{BufferedWriter, File, FileWriter}
import java.sql.{Connection, DriverManager}
import net.sf.log4jdbc.sql.jdbcapi.ConnectionSpy
import org.apache.spark.sql.{DataFrame, SparkSession, Column, SQLContext}
import org.apache.spark.sql.functions._
import org.postgresql.jdbc.PgConnection
spark.read
.option("charset", "utf-8")
.option("header", "true")
.option("quote", "\"")
.option("delimiter", ",")
.csv(...)
Es funktioniert gut. Das Problem ist, dass der Optionsschlüssel spark read (DataFrameReader) nicht derselbe ist wie der Verweis (link). Hinweis sagte, ich sollte "Codierung" für die Codierung verwenden, aber nicht funktioniert, aber Zeichensatz funktioniert gut. Ist die Referenz falsch?
Ich half mir viel :) –