2017-10-23 1 views
1

Ich verwende R-Code auf einem Elastic MapReduce-Cluster in AWS, Daten aus einem S3-Bucket importiert. Ich teste einige Funktionen von Apache Spark mit der SparkR-Bibliothek. Hier ist der Code, den ich ausführen möchte."Unused Argument (ersetzen = FALSE)" Fehler mit Beispiel() in R (auf AWS)

mnist_train <- SparkR::read.df("s3a://spark-rstudio-test-new/mnist_train.csv", 
        header = "false", source = "csv", 
        inferSchema = "true", na.strings = "") 
subsamplesize <- 30000 
subsample <- sample(nrow(mnist_train), subsamplesize, replace = FALSE) 

Dies gibt die folgenden Fehler:

"Fehler in Probe (nRow (mnist_train), subsamplesize Ersetzen = F): nicht verwendetes Argument (replace = F)"

dasselbe Stück Code funktioniert auf meinem lokalen RStudio. Was ist denn hier los? Ich wäre sehr dankbar für jede Richtung.

Antwort

0

Es scheint wie SparkR-Implementierung, die inkompatible Signatur hat, schattiert die von base. Die Verwendung eines vollständig qualifizierten Namens sollte den folgenden Trick erfüllen:

base::sample(nrow(mnist_train), subsamplesize, replace = FALSE) 
+0

Das ist es, danke! –

Verwandte Themen