2016-03-20 9 views
0

Ich habe ein Dataset, das während zwei bestimmter Zeitachsen Antworten auf Umfragefragen enthält. Ich möchte diesen Datensätzen beitreten, aber die Variablennamen sind identisch. Wie kann ich die Variablennamen in beiden Datasets ändern, damit ich sie erfolgreich verbinden kann?Kombinieren von Datasets mit umbenannten Variablen

ID Q1 Q2 Q3 Q4 etc ...

Ich möchte das Jahr '1995', um es hinzuzufügen, damit es 1995Q1 199Q2 wird so weiter. ich für einen anderen Datensatz, dass wollen thatll sagen 1997.

data test; 
rename q1 = 1995q1; * and so on this will continue * 
set test.one; 
run; 
proc print data =test; 
run; 

Aber itll immer dann nehmen, wenn ich mehr als 50 Fragen haben. Was ist eine effiziente Möglichkeit, diese Umbenennungsmethode zu tun und dann die beiden Datensätze

Antwort

1

Ich würde vorschlagen, stattdessen die Daten zu stapeln. Auf diese Weise wird die Analyse auf lange Sicht vereinfacht. Stellen Sie sicher, dass eine Variable für das Jahr hinzugefügt wird. Dies ist nur sinnvoll, wenn Q1 zeitlich gleich ist.

data stacked; 
    set y1995 (in=a) 
     y2015 (in=b); 
if a then year=1995; else year=2015; 
run; 

Andernfalls können Sie mit einer Variablenliste umbenennen - vorausgesetzt, Sie haben konsistente Namen.

rename q1-q50 = Y1995_Q1 - Y1995_Q50; 
Verwandte Themen