Ich habe Daten wie unten haben:Reshape lang breit, wo die meisten Spalten mehrere Werte
IDnum zipcode City County State
10011 36006 Billingsley Autauga AL
10011 36022 Deatsville Autauga AL
10011 36051 Marbury Autauga AL
10011 36051 Prattville Autauga AL
10011 36066 Prattville Autauga AL
10011 36067 Verbena Autauga AL
10011 36091 Selma Autauga AL
10011 36703 Jones Autauga AL
10011 36749 Plantersville Autauga AL
10011 36758 Uriah Autauga AL
10011 36480 Atmore Autauga AL
10011 36502 Bon Secour Autauga AL
Ich habe eine Liste von zipcodes, die Städte, die sie umfassen, und Landkreise/Staaten sie sich befinden IDNUM = Numerisch. Wert für Grafschaft und Staat, kombiniert. Liste ist im Format, das Sie jetzt sehen, ich muss es von lang nach breit/vertikal zu horizontal umformen, wobei die IDnum-Variable der eindeutige Bezeichner wird und alle anderen möglichen Wertekombinationen zu breiten Variablen werden.
Dies ist nur ein Beispiel für den Datensatz, es umfasst jede Zip in den USA und enthält mehr Variablen. Ich habe andere ähnliche Fragen und Antworten gesehen, aber nicht, wo es in fast jeder Spalte mehrere Werte gibt.
Es gibt Befehle in SPSS und STATA, die Daten auf diese Weise umformen, in SPSS kann ich einen Restruktur/Fälle zu Vars Befehl ausführen, der 11 Variablen in meinem ursprünglichen Datensatz in etwa 1750, b/c eine Grafschaft hat über 290 Reißverschlüsse und es repliziert die meisten anderen Variablen 290+ mal. Dadurch werden viele Leerzeichen erzeugt, aber ich muss es in eine sehr lange horizontale Datei umformen.
Ich habe umgeformt und umgestalten2, und bin auf die 'Standard auf Länge' Fehlermeldung aufgehängt. Ich habe schmelzen/übertragen, um eine Arbeit zu erledigen, aber dies erzeugt eine Variable, die eine Liste aller Werte ist, anstatt Variablen für jeden Wert zu erstellen.
melted_dupes <- melt(zip_code_list_dupes, id.vars= c("IDnum"))
HRZ_dupes <- dcast(melted_dupes, IDnum ~ variable, fun.aggregate = list)
Ich habe versucht, tidyr und dplyr aber in der Syntax verloren. Ich bin etwas überrascht, dass es keine Befehle gibt, die den in anderen Paketen eingebauten Befehlen ähnlich sind, was mich davon ausgeht, dass es solche gibt, und ich habe es einfach nicht herausgefunden.
Jede Hilfe wird geschätzt.
Thank you! Wie bekomme ich das im Dataframe angezeigt? Ich benutze RStudio, und das Ergebnis zeigt mir die Variablennamen, die ich erwarten würde, aber es ist alles in der Konsole, und ich schaue auf das DataPane, und es sagt immer noch 43, xxxx Obs von 12 Variablen, nicht 3, xxx obs von 1750 Variablen. Fehle ich etwas? Wie bekomme ich das Ergebnis, um tatsächlich im Datenrahmen angezeigt zu werden, damit ich es anzeigen kann, anstatt nur in der Konsole? Ich war auch auf der Suche nach einer sequentiellen Anzahl Var, also danke auch dafür. –