2016-06-30 2 views
0

In der DTA-Datei, gibt es in dieser SpalteZeilen können nicht mit na entfernt werden. Stata sagt zweideutig Abkürzung

ColumnA 
1 
2 
1 
na 
. 
. 

so will ich na und beseitigen.

Aber wenn ich

drop if ColumnA==na 

dann sagt Stata (in rot)

na ambiguous abbreviation 

Was ist das? Wie kann ich Zeilen mit "na" erfolgreich eliminieren?

+1

Am besten denken und schreiben Sie nicht Zeilen, sondern Beobachtungen, nicht Spalten, sondern Variablen, wenn Sie in Stata arbeiten: das ist zu Ihrem eigenen besseren Verständnis beim Lesen der Dokumentation und gibt extra Klarheit, wenn Probleme erfahreneren Benutzern gemeldet werden. –

Antwort

3

Dies bedeutet, dass Sie zwei (oder mehr) Variablen haben, die mit dem Stub na beginnen. Stata interpretiert, was Sie als drop die Beobachtung eingegeben haben, wenn der Wert ColumnA gleich dem Wert der Variablen na ist. Da Stata nicht weiß, welche na Variable Sie meinen, ist es fehlerhaft.

Sie sollten entweder von diesen verwenden, wenn ColumnA eine Variable string ist:

drop if ColumnA == "na" | ColumnA == "." 
drop if inlist(ColumnA,"na",".") 

Wenn stattdessen ColumnA eine numerische Variable mit ganzzahligen Werten ist, die einen Wert Etikett versehen ist, müssen Sie den Label-Namen wie folgt angeben :

drop if ColumnA == "na":ColumnA_Value_Label 

Sie können den Wert Markennamen erhalten mit

describe ColumnA 
+0

Darüber hinaus wird 'direct na *' dir sagen, welche Variablen Namen haben, die 'na' beginnen. –

Verwandte Themen