Ich versuche, Vorhersagen mit linearen Modell zu tun, betrachten Sie einen Datensatz mit 2 Spalten und folgenden Daten (1,1) (2, .5), (3,3), (4,5) , (5,5,5), (6,7) (8,8) (9,9) (10,10) .. I kann als lineares ModellVorhersage fehlender Werte mit Rxpredict
lm <- rxlinMod(col1~col2, data=test)
passen und dann rxpredict als
laufenpd <- rxPredict(lm,data=test)
das Ergebnis rxpredict
gegeben, wie kann ich den Wert von col2
finde jetzt, wo col1
Wert nicht verfügbar ist, beispielsweise, was der Wert von col2
wenn seine col1
ist 7.
Update: Paket ist revoscaler
Daten
col1,col2
1,1
2,2
3,3
4,4
5,5
6,6
8,8
9,9
10,10
infile <- file.path("C:/R-Spark", "test.csv")
test <- rxImport(infile)
library(rpart)
lm <- rxLinMod(col1 ~ col2, data = test)
rxPredict(lm,data = test)
Rechenzeit: 0,003 Sekunden.
Ausgang
> rxPredict(lm,data = test)
Rows Read: 10, Total Rows Processed: 10, Total Chunk Time: 0.002 seconds
col1_Pred
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
Frage: Nun, wenn ich den vorhergesagten Wert von nur 7, wie kann ich die Daten filtert aus dem rxpredict Ausgang
Bitte zeigen Sie ein reproduzierbares Beispiel und den Paketnamen (RevoScaleR?) – akrun
Sie können ein Modell nicht verwenden, um y vorherzusagen, x, um x vorherzusagen. –