2016-04-25 4 views
6

Ich habe eine 'Benutzer' Tabelle in MySQL. Ich möchte es in meinem Spark SQL-Programm lesen. Wie kann ich die Tabelle von MySQL zum SparkSQL-Modul von Apache Spark mit Python lesen? Gibt es einen Connector, den ich für diese Aufgabe verwenden kann? Danke.SparkSQL aus MySQL-Datenbank-Tabelle mit Python lesen

Antwort

6

Es gibt eine similar question answered. Starten Sie pyspark wie diese

./bin/pyspark --packages mysql:mysql-connector-java:5.1.38 

Dann laufen nur

sqlContext.read.format("jdbc").options(
url ="jdbc:mysql://localhost/mysql", 
driver="com.mysql.jdbc.Driver", 
dbtable="user", 
user="root", 
password="" 
).load().take(10) 

Dies würde höchstwahrscheinlich gerade arbeiten. Aber das hängt von Ihrer MySQL-Konfiguration ab, wenn Sie nicht versuchen, das Passwort, den Benutzernamen, die db-URL und andere Einstellungen zu ändern.