Ich habe eine unordentliche Datenmenge, die Nachnamen, Vornamen, Adressen (in dieser Reihenfolge) in einer Variablen enthält, während ich 2 verschiedene (Namen und Adresse) benötigen würde. Ich versuchteSAS split lange Zeichenvariable in 2 Variablen
data commainvest (keep=appln_id person_id person_name lastname firstnames newname address);
set commainvest;
lastname=scan(person_name,1,',') ;
firstnames=scan(person_name,2,',') ;
newname=catx(', ',lastname,firstnames) ;
address=substr(person_name,1,length(person_name)-length(newname)) ;
run;
und andere wie
address= substr(person_name,-1,length(person_name)-length(newname)) ;
oder
address= scan(person_name,3,length(person_name)) ;
aber es macht immer die Adresse Teil falsch oder lässt alle Informationen in der letzten Spalte. Es ist auch nicht nötig, den Vor- und Nachnamen zu trennen, aber ich könnte einen Weg finden, sie von Anfang an zusammen zu lassen. Meine Daten sind durch Kommata getrennt. Ich schätze Ihre Hilfe Dank Anna
können Sie ein Beispiel Ihrer Daten zeigen? –
Es wäre viel einfacher zu sehen, was passiert, wenn ich eine Zeile der Daten sehen könnte –