Okay, ich bin zurück und dieses Mal habe ich ein reproduzierbares Beispiel mitgebracht.Phantom NA Datensätze erstellt von Subsetting
fileURL <- "https://d396qusza40orc.cloudfront.net/getdata%2Fdata%2Fss06hid.csv"
download.file(fileURL, destfile = "./acs.csv")
acs <- read.csv("./acs.csv")
mySubset <- acs[acs$ACR == 3 & acs$AGS == 6, ]
Was ich erwarte, dass in mySubset
sehen, ist die 77 Datensätze aus dem 6496, die diese Bedingung erfüllen. Was ich jedoch am Ende habe, sind meine 77 erwarteten Datensätze und 1.036 unerwarteten Datensätze, die für alle Spalten vollständig NA
sind.
Was verstehe ich hier nicht?
Probieren Sie 'mySubset <- acs aus [which (acs $ ACR == 3 & acs $ AGS == 6),]' – G5W
Das ist eine bessere Lösung. Ich war gerade dabei, eine zufällige Kolumne aufzuspüren, aber es hat mich irgendwie verrückt gemacht, dass ich nicht verfolgt habe, was passiert ist. –