Ich möchte mit Adist Bearbeitungsabstand zwischen den Werten von zwei Spalten in jeder Zeile berechnen.mit Adist auf zwei Spalten von Datenrahmen
Ich benutze es in mehr oder weniger so:
A <- c("mad","car")
B <- c("mug","cat")
my_df <- data.frame(A,B)
my_df$dist <- adist(my_df$A, my_df$B, ignore.case = TRUE)
my_df <- my_df[order(dist),]
Die letzten beiden Zeilen sind die gleichen wie in meinem Fall, aber die tatsächliche Datenrahmen sieht ein bisschen anders - Spalten meiner ursprünglichen Datenrahmen sind Zeichentyp, nicht Faktor. Auch die Dist-Spalte scheint als 2-Spalten-Matrix zurückgegeben zu werden, ich habe keine Ahnung, warum es passiert.
Update: ich ein bisschen gelesen und fand, dass ich es über die Zeilen anwenden muß, so mein neuer Code folgt:
apply(my_df, 1, function(d) adist(d[1], d[2]))
Es funktioniert gut, aber für meine ursprünglichen Daten-Set nennt es von Spaltennummern ist unpraktisch, wie kann ich auf Spaltennamen in dieser Funktion verweisen?
Funktioniert perfekt, danke! – PrzeM