Ich habe mir den Kopf gebrochen, um zu verstehen, wie man das macht, aber bis jetzt konnte ich keine einfache Lösung finden. Ich habe folgende Daten-Set:Gruppieren, zusammenfassen und kombinieren Variablen
Itin Origin Destination Passengers
1 A B 1
1 B C 1
2 A B 3
3 E B 10
4 A C 2
5 E B 4
Was ich versuche auf das Itin
Variable zu tun basiert, eine Pfadvariable zu schaffen, während die Passagiere variabel zu halten. Der einfachste Weg, dies zu verstehen, besteht darin, einen normalen Flug mit einer Skala zu sehen. Zum Beispiel in Itin = 1
ein Passagier geht von A nach B nach C. Das einzige, was zu halten ist, ist die Herkunft A
Destination B
, Ziel C
und Passagiere wie es ist, die gleich 1 ist. Genau wie im folgenden Beispiel.
Path Passengers
A-B-C 1
A-B 3
E-B 10
A-C 2
E-B 4
Ich habe mit group_by mit dplyr mehrere Möglichkeiten ausprobiert, wie es oft schneller als die Basisoptionen, aber ich konnte nicht wirklich das Ergebnis als im zweiten Beispiel mit einem neuen Variablen Pfad erhalten. Ich dachte mir auch, ich benutze tidyr, aber ich bin mir nicht sicher, wie es hier helfen könnte. Irgendeine Idee, wie man das macht?
Edit: Was die Variable Pfad, es ist nicht wirklich wichtig, wenn als A-B-C
endet, oder A,B,C
oder A B C
wie ich nur die Syntax aussehen wird.
Können Sie davon ausgehen, dass der Datensatz sortiert ist? d.h. der erste Abschnitt des Fluges ist die erste Reihe für diese bestimmte Route. – thc
@thc ja es ist ja so sortiert wie ich es schon vorher gemacht habe. – FilipeTeixeira