Ich brauche etwas Hilfe. Ich habe die folgende Tabelle:R Anzahl der Strings durch zwei Faktoren
country_code=c(1,1,1,1,1,1,2,2,2,2,2,2)
target=c('V1','V1','V2','V2','V3','V3','V1','V1','V2','V2','V3','V3')
M1=c('X7','X7','X14','X14','X8','X8','X29','X22','X2','X22','X22','X22')
M2=c('X1','X1','X17','X11','X21','X21','X1','X29','X8','X18','X24','X24')
M3=c('NA','NA','NA','X1','NA','NA','NA','NA','NA','NA','NA','NA')
CountofRun=c(1,2,1,2,1,2,1,2,1,2,1,2)
df<-data.frame(country_code,target,M1,M2,M3,CountofRun)
und ich möchte eine Frequenztabelle für jeden country_code und Ziel Kombination erhalten. So zum Beispiel, wenn X7 in allen drei Läufen erscheint für country_code = 1 und target = V1, X7 bis 3. summiert werden muss, wie Sie sehen, bin ich nur daran interessiert, das Zählen der Anzahl der Male, jeweils Die X1 bis X30 erscheinen in diesen 3 Läufen für jede von 6 Kombinationen von Country_Code und Target. Ich kann nicht zu numerisch konvertieren.
Die ultimative Tisch, hoffentlich wird so aussehen
Gibt es einen Grund keine 'Tabelle zu verwenden, (df $ country_code, df $ target) '? – jakub
Hallo Steven und danke, dass du dir die Zeit genommen hast. Ich habe data.table und die einfache aggregate() Zusammenfassung() versucht und sogar versucht, compare() von einem anderen Paket zu verwenden. Ich glaube, dass die Lösung mit dplyr oder einer Version von apply liegen kann, aber ich bin verloren. –
@jakub Dieser Code gibt nicht die Ausgabe, nach der ich bin. Tatsächlich werden die Informationen, die ich brauche, von der Ausgabe dieses Codes entfernt. Ich muss zählen, wie viel Zeit jede der X1 bis X30 für jede Kombination von country_code und Ziel erscheinen. –