Ich habe einen Datenrahmen derzeit in einem breiten Format, das vor und nach der Intervention Fragebögen hat. Es gibt 848 Patienten mit mindestens einem Fragebogen. Ich würde gerne die Daten betrachten, um zu vergleichen, wie sich die Werte von vor und nach der Intervention geändert haben. Ich kämpfe jedoch, da diese Daten in einem breiten Format vorliegen und die Daten hinsichtlich der Anzahl der Fragebögen pro Patient nicht einheitlich sind. Es gibt eine Variable, die die Instanz des Fragebogens auflistet und der Wert des Fragebogens ist eine weitere Variable. HierKombinieren von Variablen im Wide-Format in R
ist ein Beispiel dafür, wie es aussieht, zur Zeit:
a=c('instance1','total1','instance2', 'total2', 'instance3', 'total3',
'instance4','total4', 'instance5','total5')
b=c('postop2', '5', 'postop1', '7', NA, NA, 'preop', '10', NA, NA)
c=c(NA, NA, 'preop', '3', NA, NA, 'postop1', '4', 'postop2', '3')
data.frame(rbind(a,b,c))
Es gibt 848 Zeilen von Befragungsdaten.
Ich muss die Unterschiede von Preop zu Postop Fragebögen berechnen. Was ist der beste Weg, um diese Daten zu reorganisieren, damit ich diese Werte bekommen kann? Ich kämpfe, da die Fälle nicht zwischen allen 848 Patienten liegen.
Danke für Ihre Hilfe.
Wenn Sie Ihr Beispiel betrachten, nehme ich an, dass die Spaltennamen die erste Zeile anstelle von 'X1', 'X2' usw. wären. – akrun
ja, Spaltennamen sind die erste Zeile –