ich einen Datenrahmen des folgenden Typs haben:Werte Vergleich unter Spalten-Kombinationen
date ID1 ID2 sum
2017-1-5 1 a 200
2017-1-5 1 b 150
2017-1-5 2 a 300
2017-1-4 1 a 200
2017-1-4 1 b 120
2017-1-4 2 a 300
2017-1-3 1 b 150
Ich versuche, zwischen den Spalten Kombinationen über verschiedenen Zeitpunkten zu vergleichen, um zu sehen, ob die sum
Werte gleich sind. Also, in dem oben genannten Beispiel möchte ich den Code zu identifizieren, dass die Summe der [ID1=1, ID2=b]
Kombination ist zwischen 2017-1-5 und 2017-1-4 (In meinen realen Daten habe ich mehr als 2 ID
Kategorien und mehr als 2 Dates
).
Ich möchte, dass meine Ausgabe ein Datenrahmen ist, der alle Kombinationen enthält, die (mindestens ein) ungleiche Ergebnisse enthalten. In meinem Beispiel:
date ID1 ID2 sum
2017-1-5 1 b 150
2017-1-4 1 b 120
2017-1-3 1 b 150
Ich versuchte es mit Schleifen wie diese zu lösen: Is there a R function that applies a function to each pair of columns ohne großen Erfolg.
Ihre Hilfe wird geschätzt.
Wie soll Ihre Ausgabe aussehen? Wenn Sie mehr als zwei Daten für eine Kombination von IDs haben, möchten Sie nur angeben, dass sie alle gleich sind oder nicht? Oder wollen Sie die einzigartigen identifizieren, oder was? – aichao
Ich möchte ** die Kombination kennzeichnen, wo die Summe nicht gleich war; zB ein Datenrahmen, der wie folgt aussieht: (Zeilen; 'Datum') und (Spalten;' ID1', 'ID2',' Summe') ... so in meinem Beispiel: (1. Zeile = '2017-1 -5') (2. Zeile = '2017-1-4') und (1. Spalte =' ID1') (2. Spalte = 'ID2') (3. Spalte =' Summe') ... und die 2 Zellen werden angezeigt 150 und 120. Hoffe, es war klar .. Ich könnte meine Frage ändern .. – staove7
Was ist, wenn Sie drei Daten haben und zwei von ihnen die gleiche Summe haben, aber die dritte nicht? Welche der beiden möchten Sie dann in Ihrer Ausgabe kennzeichnen? – aichao