Ich habe Kopie kleistert eine Linie, die wie diesewholeTextFiles Unterschied zwischen Shell und App
val files = sc.wholeTextFiles("file:///path/to/files/*.csv")
aus der Spark-Shell sieht, wo es läuft, zu einer Anwendung, wo es nicht läuft. Stattdessen bekomme ich, dass das Muster 0 Dateien entspricht, obwohl ich in der Shell alle Dateien sehen kann und Spark sie liest.
Was fehlt mir? Ist das ein Dateiberechtigungs-Problem?
Ich bin mit der App wie folgt:
spark-submit \
--master yarn \
--deploy-mode cluster \
--files /usr/hdp/current/spark/conf/hive-site.xml \
--num-executors 20 \
--driver-memory 8G \
--executor-memory 4G \
--class com.myorg.pkg.MyApp \
MyApp-assembly-0.1.jar
ist Ihre Datei im lokalen Dateisystem oder in den hdfs vorhanden? –
Liefern Sie den absoluten Pfad oder einen relativen Pfad? – user1314742
Es ist auf dem lokalen FS und der Pfad ist wie im Beispiel: Absolut. – Ian