Ich habe einen Datensatz (test_data
) über Bürgerkriege zwischen 1989-2016. Die Einheit der Analyse ist _DyadID_
, die die eindeutige Kennung für jedes Paar von Akteuren in einem zivilen Konflikt in diesem Zeitraum ist. Der Datensatz enthält auch _SideA_
und _SideB_
, die die Namen der Akteure in einer bestimmten Dyade sind. Jede Reihe ist ein "Ereignis" bewaffneter Gewalt, bei dem es eine Variable für die Anzahl der Todesfälle auf der Seite A gibt (_deaths-a_
) und die Anzahl der Todesfälle auf der Seite B (_deaths-b_
). Schließlich gibt es eine Variable, die das Monat-Jahr jedes Ereignisses anzeigt.Aggregierende Zähldaten
Für meine Forschung, ich brauche die Anzahl der _deaths-a_
und Anzahl der _deaths-b_
pro Monat wissen. Im Grunde möchte ich am Ende einen Datensatz haben, der mir monatliche Daten über Todeszahlen für jede _DyadID_
zeigt. Ich habe es geschafft über alle Konflikte pro Monat Gesamtzahl der A/B-Todesfälle zu zeigen, mit dem folgenden Code:
monthly_deaths_a <- aggregate(deaths_a ~ year_month, test_data, sum)
monthly_deaths_b <- aggregate(deaths_b ~ year_month, test_data, sum)
aber nicht wissen, wie diese Daten für jeden Dyade aufgeschlüsselt zu bekommen.
Wenn jemand einen Weg vorschlagen könnte, wäre ich sehr dankbar! Prost
Ausgezeichnet! Das hat perfekt funktioniert, vielen Dank. –
Hallo nochmal! Ich habe versucht, den gleichen Code zu reproduzieren, aber für die komplexere Version meiner Daten, die insgesamt 42 Variablen hat. df <- data.frame (brd_ged $ DyadID, brd_ged $ ConflictID, brd_ged $ year_month, brd_ged $ LocationInc, brd_ged $ Seite A, brd_ged $ SideA2nd .. etc) df2. <- Aggregat (~ brd_ged.DyadID + brd_ged .year_month, df, sum) Aber ich bekomme "Fehler: keine Zeilen zu aggregieren". Ich kann sehen, warum, weil es nicht weiß, welche zwei Variablen ich die Summe von d. H. Todesfälle_a und Todesfälle_b finden möchte, aber wie kann ich dies in der Formel angeben? –
'Aggregat (. ~ Brd_ged.DyadID + brd_ged.year_month, df Summe)' 'Änderung Aggregat (. ~ Brd_ged $ DyadID + brd_ged $ year_month, df Summe)' – pyll