Ich habe folgende Datenrahmen:Python: 2 Spalten mit Listen. Wie bekomme ich eine neue Spalte, die alle gemeinsamen Werte zwischen diesen 2 Listen entfernt?
carrier flightnumber departureAirport arrivalAirport effectiveDate date group_dates
0 4U 9748 DUS GVA 2017-05-09 [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
1 4U 9748 DUS GVA 2017-05-14 [2017-05-14, 2017-05-15, 2017-05-16, 2017-05-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
2 4U 9748 DUS GVA 2017-07-08 [2017-07-08, 2017-07-09, 2017-07-10, 2017-07-1... [2017-05-09, 2017-05-10, 2017-05-11, 2017-05-1...
3 AG 1234 SFO DFW 2017-03-09 [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1... [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1...
4 AG 1234 SFO DFW 2017-03-14 [2017-03-14, 2017-03-15, 2017-03-16, 2017-03-1... [2017-03-09, 2017-03-10, 2017-03-11, 2017-03-1...
Ich möchte eine neue Spalte erstellen, die im Grunde die gleiche wie die Spalte group_dates
ist aber jedes Element in der Spalte Entfernen date
Hier ist, was ich getan habe :
habe ich eine Funktion individuelle und übergeben es an apply
def get_unique_dates(row):
return [x for x in row['group_dates'] if x not in row['date']]
df['unique_dates'] = df.apply(get_unique_dates, axis=1)
Aber dies ist der folgende Fehler zurückgegeben:
ValueError: Empty data passed with indices specified.
Welche Version ist Ihre Pandas? – frankyjuang
Ich benutze Version 0.20.1 –