Ich bin neu in Sparklyr und ziemlich neu für R. Ich versuche herauszufinden, ob ich sparkly auf meinem lokalen RStudio laufen und mit einem Apache Funf-Cluster im Netzwerk verbinden kann . Alle Blog-Beispiele sprechen davon, RStudio Server direkt auf dem Apache-Funf-Cluster zu betreiben. Kann jemand prüfen, ob das möglich ist?Verwenden von Sparklyr auf lokalen RStudio mit einem Apache-Cluster
1
A
Antwort
0
Ja, das sollte möglich sein. Zuerst - stellen Sie sicher, dass Ihr Cluster von Ihrem lokalen PC aus zugänglich ist. Wenn ja, gehen Sie zur Spark Master Webkonsole Ihres Spark-Clusters (IP-Adresse: 8080), um die URL des Masters zu erhalten ("spark: // ...").
library(sparklyr)
# Set your SPARK_HOME path
Sys.setenv(SPARK_HOME="path/to/spark_home")
config <- spark_config()
# Optionally you can modify config parameters here
sc <- spark_connect(master = "spark://paste_your_spark_master_url:7077", spark_home = Sys.getenv("SPARK_HOME"), config = config)
# Some test code, copying data to Spark cluster
iris_tbl <- copy_to(sc, iris)
flights_tbl <- copy_to(sc, nycflights13::flights, "flights")
batting_tbl <- copy_to(sc, Lahman::Batting, "batting")
src_tbls(sc)
Sie können auch versuchen, Spark lokal auszuführen. Folgen Sie einfach den Anweisungen auf der Webseite von Sparklyer: http://spark.rstudio.com/. Verwenden Sie vielleicht nur eine neuere Spark-Version (z. B. 2.0.2).
1
Wahrscheinlich möchten Sie Livy verwenden, es sei denn, Ihr Laptop befindet sich physisch in der Nähe Ihres Clusters. Siehe https://github.com/rstudio/sparklyr#connecting-through-livy.
Verwandte Themen
- 1. RStudio/Sparklyr auf MAPR/Spark - Ersetzen, um. in string
- 2. mit Sparklyr in RStudio, kann ich eine lokale CSV-Datei zu einem Funken-Cluster hochladen
- 3. Lesen von CSV-Dateien, die auf hdfs mit sparklyr vom lokalen Desktop gespeichert werden
- 4. Angeben von Spaltenklassen mit sparklyr
- 5. "GC Overhead Limit überschritten" auf Cache großen Datensatzes in Spark-Speicher (via Sparklyr & RStudio)
- 6. Fehler beim Versuch, von Rstudio zu verbinden SPARK-Paket mit sparklyr
- 7. Installieren Funken sparklyr und spark_install Fehler mit
- 8. Unterschied zwischen der Verwendung von RStudio auf einer virtuellen Maschine und Rstudio auf RServer
- 9. Schließen Sie Sparklyr an Remote-Funkverbindung an
- 10. Verwenden von TFS-Builddefinitionen auf einem lokalen Rechner
- 11. Matrix Mathe mit Sparklyr
- 12. Letzte Zeilen von einem Spark DataFrame (mit sparklyr & dplyr)
- 13. Installieren von RStudio auf EMR
- 14. Ausfallen zu verbinden mit sparklyr Spark
- 15. gelöschte Tabellen bei Verwendung von left_joint mit sparklyr
- 16. Erlang: Verwenden Sie Run_erl auf einem [lokalen] Release?
- 17. Verwenden von lokalen Bootstrap3 mit Angular
- 18. Verwenden von lokalen Mypy-Stubs
- 19. sparklyr - Remote-Hadoop-Cluster verbinden
- 20. RStudio lokal + R cloudly
- 21. Sparklyr copy_to schlägt fehl
- 22. Sparklyr Split Strings
- 23. Erstellen von Paketinformationen mit RStudio?
- 24. Wie speichert man Daten in einem Spark-Cluster mit Sparklyr?
- 25. Composer mit lokalen Abhängigkeiten verwenden
- 26. sparklyr pivot Datenrahmen
- 27. Verbinde R mit Spark in Rstudio - Fehler beim Starten der Spark-Shell. Port-Datei existiert nicht
- 28. RStudio: Unerwarteter Aufruf von `dir.create()` mit der ersten Anweisung in einem Projekt auf einem Netzlaufwerk
- 29. R- Shiny Webserver auf einem lokalen Server
- 30. Verbinden mit einem Client Cassandra von lokalen