ich eine Dataframe genannt Quelle haben, eine Tabelle aus mysqlWie konvertiert RDD [Row] zu RDD [Zeichenfolge]
val source = sqlContext.read.jdbc(jdbcUrl, "source", connectionProperties)
ich es RDD von
val sourceRdd = source.rdd
aber seine RDD umgewandelt haben [Row] ich brauche RDD [Zeichenfolge] Transformationen zu tun, wie
source.map(rec => (rec.split(",")(0).toInt, rec)), .subtractByKey(), etc..
Danke
Können Sie die Ausgabe von 'source.printSchema' hinzufügen? Ich möchte Ihnen zeigen, wie Sie vermeiden können, auf RDD-Ebene zu gehen (was Sie nicht um jeden Preis tun sollten). –