Ich versuche, zwei verschiedene Datenrahmen basierend auf Firmennamen mit der agrep-Funktion unscharf zu finden. Um meinen Abgleich zu verbessern, möchte ich nur Unternehmen zuordnen, die sich im selben Land befinden.Unscharfe Übereinstimmung nach Kategorie
df1: df2:
Company ISO Company ISO
Aalberts Industries NL Aalberts NL
Allison NL Allison transmission NL
Allison UK Allison transmission UK
Ich verwende die folgende Funktion zum Spiel:
testb$test <- ""
for(i in 1:dim(testb)[1]) {x2 <- agrep(testb$name[i], testa$name, ignore.case=TRUE, value=TRUE, max.distance = Inf, useBytes = TRUE, fixed = TRUE)
x2 <- paste0(x2,"")
testb$test2[i] <- x2
}
ich eine Teilmenge für jedes Land erstellen und als jede Teilmenge entsprechen, die funktionieren, ist aber zeitaufwendig. Gibt es eine andere Möglichkeit, R nur mit Firmennamen übereinstimmen zu lassen, wenn df1 $ ISO = df2 $ ISO? Vielen Dank!