Ich möchte IDs mit leeren Größen eine Größe basierend auf der Häufigkeitsverteilung ihrer Gruppe zuweisen.Fehlende Variablenwerte basierend auf Verteilung zuweisen SAS
Datensatz A enthält eine Momentaufnahme meiner Daten:
ID Group Size
1 A Large
2 B Small
3 C Small
5 D Medium
6 C Large
7 B Medium
8 B -
Datensatz B zeigt die Häufigkeitsverteilung der Größen unter den Gruppen:
Group Small Medium Large
A 0.31 0.25 0.44
B 0.43 0.22 0.35
C 0.10 0.13 0.78
D 0.29 0.27 0.44
Für ID 8, wissen wir, dass es eine hat 43% Wahrscheinlichkeit, "klein" zu sein, 22% Wahrscheinlichkeit "mittel" und 35% Wahrscheinlichkeit "groß" zu sein. Das liegt daran, dass dies die Größenverteilungen für Gruppe B sind.
Wie weise ich ID 8 (und anderen leeren IDs) eine Größe zu, die auf den Gruppenverteilungen in Datensatz B basiert? Ich benutze SAS 9.4. Makros, SQL, alles ist willkommen!
Das hat funktioniert! Danke für Ihre Hilfe. – user3910919