Ich habe einen Datensatz mit über 100 000 Zeilen. Ich möchte für jede Zeile eine Anzahl von Auftritten in einer bestimmten Spalte finden und sie in einer anderen Spalte speichern (siehe Beispiel unten).R zählen und speichern die Anzahl der Duplikate in einer anderen Spalte
Ich könnte durch den gesamten Datensatz für jede Zeile durchlaufen, aber das wäre 100k * 100k Iterationen. Gibt es dafür einen effizienteren Weg?
Eingabedatensatz
A B
1 6
3 1
2 6
4 2
1 4
9 1
Output-Datensatz
A B number_of_appearances (based on column B)
1 6 2
3 1 2
2 6 2
4 2 1
1 4 1
9 1 2