Ich habe das graphframes
-Paket (von here) heruntergeladen und auf meiner lokalen Festplatte gespeichert. Jetzt möchte ich es benutzen. So verwende ich den folgenden Befehl ein:Importieren von PySpark-Paketen
IPYTHON_OPTS="notebook --no-browser" pyspark --num-executors=4 --name gorelikboris_notebook_1 --py-files ~/temp/graphframes-0.1.0-spark1.5.jar --jars ~/temp/graphframes-0.1.0-spark1.5.jar --packages graphframes:graphframes:0.1.0-spark1.5
die alle pyspark Funktionalität funktioniert wie erwartet, mit Ausnahme des neuen graphframes
Paket: wenn ich zu import graphframes
versuchen, erhalte ich eine ImportError
. Wenn ich sys.path
überprüfe, kann ich die folgenden zwei Pfade sehen:
/tmp/spark-1eXXX/userFiles-9XXX/graphframes_graphframes-0.1.0-spark1.5.jar
und /tmp/spark-1eXXX/userFiles-9XXX/graphframes-0.1.0-spark1.5.jar
, jedoch diese Dateien existieren nicht. Darüber hinaus ist das Verzeichnis /tmp/spark-1eXXX/userFiles-9XXX/
leer.
Was fehlt mir?