Python Pandas Frage:Wie summieren Sie Spaltenwerte mit Spaltenübereinstimmung?
Ich habe eine Tabelle mit drei Spalten: From_City, To_City, Trip_Count und 4 Reihen:
+-----------+---------+------------+ | From_City | To_City | Trip_Count | +-----------+---------+------------+ | Berlin | London | 2 | | London | Berlin | 3 | | Sydney | Tokyo | 4 | | Tokyo | Sydney | 6 | +-----------+---------+------------+
ich Reisen zwischen den Städten, in eine neue Tabelle summieren möchten, die 2 hat nur Zeilen:
+--------+------------+------------+ | City | Other_City | Trip_Count | +--------+------------+------------+ | Berlin | London | 5 | | Sydney | Tokyo | 10 | +--------+------------+------------+
ich kann nicht herausfinden, wie dies in Python zu erreichen (vorzugsweise in Pandas). Irgendwelche Vorschläge? Vielen Dank!
Hinweis: Bestellung zwischen zwei Städten spielt keine Rolle. entweder Berlin-London oder London-Berlin ist in Ordnung.
In SQL konnte ich die folgende tun, aber ich bin nicht sicher, wie das gleiche in Python zu tun: 'wählen mindestens (from_city, to_city) als Stadt, größte (from_city, to_city) als other_city, Summe (trip_count) als trip_count von Reisen Gruppe von mindestens (from_city, to_city), am größten (from_city, to_city) ' –