2017-08-19 3 views
0

Ich habe einen Datensatz mit 12 Variablen, die jeweils die Werte 1 bis 4 annehmen und als Ordnungszahl behandelt werden sollen. Wenn ich nicht ihre Art angeben, werden sie als Intervalltyp behandeltSo geben Sie Ordinaldaten in die Daisy-Funktion ein

> attributes(gower_dist) 
$class 
[1] "dissimilarity" "dist"   

$Size 
[1] 5845 

$Metric 
[1] "mixed" 

$Types 
[1] "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" "I" 

aber wenn ich hinzufügen 'type = list (ordratio = 1: 12)', wird der Typ 'T' und ich bin Sicher, wofür das steht. Wenn es nicht für die Ordinalzahl steht, wie sage ich dann, dass ich Ordinaldaten eingib?

> attributes(gower_dist) 
$class 
[1] "dissimilarity" "dist"   

$Size 
[1] 5845 

$Metric 
[1] "mixed" 

$Types 
[1] "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" "T" 
+0

Möchten Sie ein korrekt reproduzierbares Beispiel teilen? – AkselA

Antwort

1

Kurze Antwort:

Wenn Sie Ordnungsverhältnisse angegeben & den resultierenden Typen „T“ beobachten, das ist das erwartete Verhalten.

Lange Antwort:

nahm ich einen Blick in die daisy Funktion. Es gibt 6 mögliche Werte für das Types Attribut:

typeCodes <- c("A", "S", "N", "O", "I", "T") 

ich durch die Funktion im Debug-Modus ein paar Mal mit unterschiedlichen Parametern radelte. Die Zuordnung zu sein scheint als für dieses Attribut folgt:

  • Wenn Sie type = list(asymm=<whichever columns in the dataset>) angeben: "A"

  • Wenn Sie type = list(symm=<whichever columns in the dataset>) angeben: "S"

  • Wenn Sie type = list(ordratio=<whichever columns in the dataset>) angeben: " T“

Wenn Sie tun nicht Typ angeben, oder yo u angeben type=list(logratio=<whichever columns in the dataset>), & Ihre Datenmenge Spalten sind:

  • Faktoren: "N"

  • bestellt: "O"

  • numerisch/Zahlen: "I"

(Ich bin mir nicht sicher, warum Logratio nicht seinen eigenen Typ bekommt, aber das geht wahrscheinlich hier los ...)

+0

Vielen Dank! – shavendy

Verwandte Themen