2010-04-08 5 views
5

Wenn die Faktorvariable Climate ist, mit 4 möglichen Werten: Tropical, Arid, Temperate, Snow und ein Knoten in meinem rpart Baum ist als "Climate: ab" gekennzeichnet, was ist der Split?Wie interpretiere ich rpart Splits auf Faktorvariablen beim Erstellen von Klassifikationsbäumen in R?

+0

Dies gehört zu stats.stackexchange.com und sollte geschlossen werden. –

+0

@Joris stimme ich nicht zu. Die Frage betrifft die Interpretation einer Programmantwort und hat nichts mit dem statistischen Hintergrund der Partitionierungsbäume und der Statistik selbst zu tun. – Marek

+0

@ Marek Wie sonst würden Sie die Interpretation einer statistischen Analyse nennen? –

Antwort

6

Ich nehme an, Sie Standardmethode verwenden Baum zu zeichnen, die

plot(f) 
text(f) 

ist, wie Sie in der Hilfe zu text.rpart lesen können, Argument pretty auf Standardfaktor Variablen werden als Buchstaben dargestellt, so a bedeutet levels(Climate)[1] und es bedeutet, dass auf dem linken Knoten sind Beobachtung mit Climate==levels(Climate)[1] und auf der rechten Seite die anderen.

Sie könnten Ebenen direkt drucken

plot(f) 
text(f, pretty=1) 

Created by rpart

verwenden, aber ich empfehlen draw.tree von maptree package:

require(maptree) 
draw.tree(f) 

Created by maptree

ich Fälschung verwendet Daten zu Plots:

X <- data.frame(
    y=rep(1:4,25), 
    Climate=rep(c("Tropical", "Arid", "Temperate", "Snow"),25) 
) 
f <- rpart(y~Climate, X) 
Verwandte Themen