Ich habe ein data.frame mit 1.000 Zeilen und 3 Spalten. Es enthält eine große Anzahl von Duplikaten und ich habe plyr verwendet, um die doppelten Zeilen zu kombinieren und eine Zählung für jede Kombination hinzuzufügen, wie in this thread erklärt.Suchen Sie doppelte Zeilen in einem dat.frame, aber ignorieren Sie die Spaltenreihenfolge
Hier ist ein Beispiel dafür, was ich jetzt habe (ich mit all den Duplikaten auch noch die ursprüngliche data.frame, wenn ich von dort aus starten müssen):
name1 name2 name3 total
1 Bob Fred Sam 30
2 Bob Joe Frank 20
3 Frank Sam Tom 25
4 Sam Tom Frank 10
5 Fred Bob Sam 15
Allerdings ist Spaltenreihenfolge nicht Angelegenheit. Ich möchte nur wissen, wie viele Zeilen die gleichen drei Einträge haben, in beliebiger Reihenfolge. Wie kann ich die Zeilen, die die gleichen Einträge enthalten, kombinieren und dabei die Reihenfolge ignorieren? In diesem Beispiel würde ich die Zeilen 1 und 5 und die Zeilen 3 und 4 kombinieren wollen.
Dies funktionierte auch (nachdem ich Leerzeichen aus data.frame-Einträgen entfernt hatte). Außerdem entfällt der Schritt zum manuellen Kopieren/Einfügen von Daten. Aber es lässt mich mit: 'name1 name2 name3 Gesamt Lookup newtotal' 1 Bob Fred Sam 30 Bob ~ Fred ~ Sam 45 2 Bob Joe Frank 20 Bob ~ Frank ~ Joe 20 3 Frank Sam Tom 25 Frank ~ Sam ~ Tom 35' – jdfinch3
Hmmm, kann Code-Block nicht in Kommentaren arbeiten ... jedoch zeigt ee die zusammengeführten Ergebnisse ohne die aktualisierten Summen und dann daneben die zusammengeführten Ergebnisse mit den aktualisierten Summen (und mit ~ ersetzen die Tabs zwischen Zeileneinträgen). Ich bin mir sicher, dass dies eine einfache Lösung ist, aber ich kenne R nicht gut genug, um es einfach zu reparieren ... – jdfinch3
Ok, ich habe mir wirklich die Zeit genommen, deinen Code durchzulesen und jede Handlung zu durchdenken und erkannte, dass die Antwort auf meine Frage noch offensichtlicher war, als ich gedacht hatte. Ich nahm nur die zwei neuen Spalten und fügte sie in einen neuen data.frame ein (und ersetzte das "~" durch "", nur um es leichter zu lesen). Vielen Dank! – jdfinch3