Ich bin auf der Suche nach einer effizienten (sowohl computerressourcebezogenen als auch lernenden/implementierenden) Methode, um zwei größere (Größe> 1 Million/300 KB RData Datei) Datenrahmen zusammenzuführen.Effiziente Alternativen zum Zusammenführen für größere data.frames R
"Merge" in der Basis R und "Join" in Plyr scheinen alle meine Speicher verbrauchen effektiv mein System zusammenbrechen.
Beispiel
Last test data frame
und versuchen
test.merged<-merge(test, test)
oder
test.merged<-join(test, test, type="all")
-
-
Der folgende Beitrag liefert eine Liste der Zusammenführung und Alternativen:
How to join (merge) data frames (inner, outer, left, right)?
Die folgende erlaubt Prüfobjekt Größe:
https://heuristically.wordpress.com/2010/01/04/r-memory-usage-statistics-variable/
produzierten Daten von anonym
sql.df oder data.table? –
Nach dem Ausnehmen der netten Antworten unten, konnte ich finden: http://stackoverflow.com/questions/4322219/whats-the-fastest-way-to-merge-join-data-frames-in-r (obwohl die Frage war nicht über große df, sondern über das Speichern von Millisekunden, bekam es ähnliche Antworten wie unten). –