Ich muss einen Fingerabdruck zu jeder Zeile in einem Dataset hinzufügen, um mit einer späteren Version des gleichen Satzes zu überprüfen, um Unterschiede zu suchen.Hinzufügen von Hash zu jeder Zeile mit dplyr und Digest in R
Ich weiß, wie Hash in R für jede Zeile hinzufügen wie folgt:
data.frame(iris,hash=apply(iris,1,digest))
Ich lerne dplyr
zu verwenden, da die Datenmenge ist riesig bekommen und ich brauche sie in SQL Server zu speichern, habe ich versucht, etwas unten wie aber der Hash nicht funktioniert, werden alle Zeilen geben den gleichen Hash:
iris %>%
rowwise() %>%
mutate(hash=digest(.))
Jeder Hinweis für reihenweise Hashing mit dplyr? Vielen Dank!