So habe ich einen Datensatz in R (Framingham Heart Study Daten), und ich versuche, BMI-Gruppen "Untergewicht zuweisen, "normal", "übergewichtig" und "fettleibig."Versuchen, Gruppen in R zuzuweisen, aber es füllt NA-Werte und fehlt andere, die in die Gruppe gehören
Es hat über 11.000 Beobachtungen und 38 Variablen/Spalten, so dass es schwierig wäre, einige der Daten hier zu veröffentlichen (ich hoffe, es wird nicht zu viel Mühe sein, ohne sie zu antworten).
Der Datensatz wird genannt frm und ich versuche, in der folgenden Art und Weise der Teilmenge:
frm$BMIGRP <- NA #Creating new variable (this part works and creates a BMIGRP column with all NA values)
frm$BMIGRP[which(as.numeric(frm$BMI) < 18.5)] <- "underweight"
Allerdings gibt es NA-Werte im Datensatz BMI Variable (angegeben mit einer, die ich habe „“ versuchte auch, zu NA zu wechseln).
Wenn ich versuche, diese Art für jede Gruppe zu unterteilen, werden nur einige der untergewichtigen Werte "untergewichtig" zugewiesen und es wird eine Menge NA/"zugewiesen". Werte zu untergewichten. Es sagt mir dann, dass es nur 10 "normale" Gewicht-Themen gibt und ungefähr 11000 in der fettleibigen Kategorie, die einfach nicht wahr ist, weil ich den Datensatz ansehen kann.
Wenn dies korrekt durchgeführt wird, sollten die vier Gruppen mit mehreren hundert bis mehreren tausend Beobachtungen in jeder Kategorie erstellt werden. Aber ich bekomme nur 10 normal, 71 untergewichtig und ~ 11.000 fettleibig.
Ich bin mir einfach nicht sicher, wo ich falsch liege oder ob es eine andere Möglichkeit gibt, wie ich eine neue Variable erstellen und sie auf die gleiche Art und Weise zuweisen kann. Jede Hilfe wird sehr geschätzt.
Ich sollte auch erwähnen, dass dies der Code ist, den mein Professor uns als Beispiel in unserer Laborsitzung gegeben hat, und ich kopiere ihn im Grunde mit dem passenden Ersatz für meinen Datensatz.
Dies ist meine erste Frage auf dieser Website, also entschuldige ich mich, wenn es unvollständig ist oder wenn ich mehr Informationen geben muss. Vielen Dank!
Überprüfen Sie die Klasse der BMI-Spalte, Klasse (frm $ BMI). Es sollte numerisch sein. – leeum
Ja, es war nicht numerisch, es war Char aus irgendeinem Grund. Vielen Dank! –