2016-10-02 9 views
-2

Ich habe eine Tabelle namens "Rauch" mit 300 Zeilen (eine Zeile für jedes Thema) und zwei Variablen ("Gruppe" und "Rennen"). Die Gruppe nimmt die Werte "Raucher", "Nichtraucher" oder "Beendet" und das Rennen nimmt die Werte "Weiß", "Schwarz", "Hispanic", "Asian".beschreibt die Beziehung zwischen zwei kategorischen Variablen?

Ich möchte eine einzelne Zeile von R-Code schreiben, die eine angemessene Beschreibung der Beziehung zwischen Rauchergruppe und Rasse ergeben wird.

+4

Dies ist keine sehr gute spezifische Programmierung Frage - noch Sie viel in der Art von Forschungsanstrengungen demonstrieren (was Sie versucht haben, warum? bist du nicht zufrieden mit den Ergebnissen?), was bei einer minderwertigen Frage manchmal helfen kann. Möchten Sie, dass eine Tabelle Kreuztabellen gibt? Verwende 'table()'. Möchten Sie ein Modell, vielleicht ein multinomiales GLM, anpassen? Wenn Sie als Ergebnis nicht wissen, was Sie wollen, müssen Sie das zuerst herausfinden. – Gregor

Antwort

1

Der typische statistische Test für die Unabhängigkeit der Assoziation von zwei kategorischen Variablen, wo keiner von ihnen hat, was ich eine natürliche Ordnung betrachten würde, wäre ein Chi-Quadrat-Test für die Unabhängigkeit.

with(dataset, chisq.test(smoke, Group)) 

Um auf den tatsächlichen Werten suchen gerade:

with(dataset, table(smoke, Group)) 
# OR 
with(dataset, prop.table(table(smoke, Group))) 
Verwandte Themen