2016-08-23 4 views
0

Ich habe einen Datensatz mit einer binären abhängigen Variable und eine Reihe von Prädiktoren, einschließlich der Teilnehmer. Ich versuche die idiosynkratischen Effekte verschiedener Prädiktoren für verschiedene Teilnehmer zu untersuchen. Um dies zu tun, versuche ich, die Auswirkungen von Interaktionen zwischen der Teilnehmer-ID und den anderen Prädiktoren auf die abhängige Variable zu untersuchen. Ich benutze randomForest in R. Ich kann die Gesamtstruktur erfolgreich anpassen und kann partielle Abhängigkeitsdiagramme für einzelne Variablen erstellen. Was ich jedoch brauche, sind partielle Abhängigkeitsdiagramme für Variablenpaare - Teilnehmer + andere. Ist das möglich?Bivariate partielle Abhängigkeit mit randomForest in R

Als Referenz mein Code:

data_sample<-data_raw[sample(1:nrow(data_raw),500,replace=F),]; 
test_rf<-randomForest(perceptually.rhotic~vowel+speaker+modified_clip_start+function_word+year_of_birth+gender+fathers_job_type+prepausal,data=data_sample,ntree=500,mtry=3); 
partialPlot(test_rf,pred.dat=data_sample,x.var="speaker"); 

??? partialPlot(test_rf,pred.dat=data_sample,x.var=c("speaker","vowel")); 

sehr vielen Dank im Voraus für jede Beratung jedermann bieten kann!

Antwort

2

Das plotmo R-Paket wird Teilabhängigkeiten für alle Variablen und Variablenpaare (bivariate Abhängigkeiten) für "jedes" Modell darstellen. Zum Beispiel:

library(randomForest) 
data(trees) 
mod <- randomForest(Volume~., data=trees) 
library(plotmo) 
plotmo(mod, pmethod="partdep") # plot partial dependencies 

die gibt

plot http://www.milbo.org/doc/plotmo-randomforest-trees.png

Sie genau angeben können, die variabel und variable Paare erhalten geplottet plotmo die mit all1, all2, degree1 und degree2 Argumente. Weitere Beispiele finden sich in der vignette for the plotmo package.

Verwandte Themen