Angenommen, ich habe eine Datensatz D1
wie folgt:SAS für Szenario folgende (häufigster Beobachtung)
ID ATR1 ATR2 ATR3
1 A R W
2 B T X
1 A S Y
2 C T E
3 D U I
1 T R W
2 C X X
Ich möchte ein Datensatz D2
daraus erstellen, wie
ID ATR1 ATR2 ATR3
1 A R W
2 C T X
3 D U I
folgt Mit anderen Worten, der Datensatz D2
besteht aus eindeutigen IDs von D1
. Für jede ID in D2
werden die Werte von ATR1-ATR3 als die häufigsten (der jeweiligen Variablen) unter den Datensätzen in D1
mit der gleichen ID ausgewählt. Zum Beispiel ID = 1 in D2
hat ATR1 = A (am häufigsten).
Ich habe eine Lösung, die sehr ungeschickt ist. Ich sortiere einfach dreimal Kopien des Datensatzes "D1" (nach ID und ATR1) und entferne Duplikate. Ich füge später die drei Datensätze zusammen, um zu bekommen, was ich will. Ich denke jedoch, dass es einen eleganten Weg dafür geben könnte. Ich habe etwa 20 solcher Variablen im ursprünglichen Datensatz.
Dank