2010-11-18 8 views
0

Wir suchen R trainieren mit Strukturen wie: Alter, data1, DATA2, ... Datan, AktionenTeildatensätze in R

wobei N von der Menge der Daten ab, die wir über eine Person haben.

Unser Ziel ist es festzustellen, wie wahrscheinlich es ist, dass eine andere Person Aktionen generieren würde, indem sie alle Daten abfragt, die wir haben.

Alter, data1, DATA2, ... dataM wo könnte M größer oder kleiner als

N. seine

Mit kompletten Datensatz wir binäre logistische Regression verwendet haben könnten. Aber wir müssen Teilmengen verwenden.

Wie berechnet man am besten die Wahrscheinlichkeit, dass eine Person Aktionen ausführt, indem sie mit Teildatensätzen fragt?

+3

Und Ihre Frage? –

+3

Was ist deine Frage? – Carl

+3

Ihre Frage ist was? – Shane

Antwort

1

Das Hmisc-Paket bietet mehrere Funktionen für die Mehrfachimputation, mit denen Sie die in Ihren Daten enthaltenen Informationen vollständiger nutzen können.

require(Hmisc) 
?aregImpute # with several worked examples 

Das begleitende Paket, rms, hat eine binäre Funktion logistische Regression:

require(rms) 
?lrm 
+0

Ich denke, das Boot-Paket ist mehr, was er sucht. Die Imputation bezieht sich vor allem auf fehlende Daten, Bootstrapping ist etwas anderes. –