die kontinuierlichen Variablen zu kategorisieren, habe ich Binning mit dem folgenden CodeWie Binning-Ergebnisse auf Rohdaten angewendet werden?
german<-read.csv("http://freakonometrics.free.fr/german_credit.csv", header=TRUE)
F=c(1,2,4,5,7,8,9,10,11,12,13,15,16,17,18,19,20,21)
for(i in F) german[,i]=as.factor(german[,i])
str(german)
german_interval<-classIntervals(german$Duration.of.Credit..month., n=4 ,style = "equal")
german_interval
Das Ergebnis Binning ist wie folgt.
style: equal
one of 4,960 possible partitions of this variable into 4 classes
[4,21) [21,38) [38,55) [55,72]
554 359 73 14
So mag ich den Wert ändern 4 < = x < 21 = 1, 21 < = x < 38 = 2, 38 < = x < 55 = 3, 55 < = x < 72 = 4 . Dann, wie Sie diesen Wert in Rohdaten anwenden ??
Wenn Sie diese Rohdaten sehen, gibt es auch eine Zielvariable. Es ist eine Kreditwürdigkeit. Und ich möchte das Verhältnis der Zielvariablen zu jedem Abschnitt wissen. Speziell, [4, 21] = 0:?%/1:?%, [21,35] = 0:?%, 1:?%. Wie macht man das als R-Code?
Glaubwürdigkeit ist eine Faktorvariable mit zwei Ebenen: "0" und "1". Du verlangst ein Verhältnis von etwas zu etwas, aber es ist überhaupt nicht klar, was diese beiden "Somethings" sind. Ich denke, Sie müssen genauer über die notwendigen Berechnungen von viel mehr Menschen werden mich fragen, dass diese Frage aus Mangel an Klarheit geschlossen werden. –