Ich habe eine data_file
der Größe 88k Reihen mit 76 Spalten.Wie zu vergleichen, ob die Liste der Elemente in jeder Zeile eines Datenrahmens in Python
Ich möchte, wenn eine Liste vergleichen: subset
= [40,49] ist in wie viele Zeilen
ich zu einem Zeitpunkt eine Zeile bin im Vergleich wie folgt:
Mein Code:
counter=0
for row in data_file.itertuples():
if all(np.isin(subset, row)):
counter = counter+1
print('Total occurences of subset: ', subset, '= ', counter)
print('--------------------------')
Ausführungszeit: 6,6398055266834035
gibt es einen besseren Weg, um alle Zeilen zu einer Zeit, zu vergleichen und Zeit sparen. Ich muss einige Untermengen überprüfen, damit die Zeit meines Codes hoch ist.
Danke,
Gopi
konnte ich dieses 'np.sum schreiben ([alle (np.isin (Teilmenge, Reihe)) für die Reihe in data_file.itertuples()]) 'aber die Ausführungszeit ist immer noch gleich – Gopi
Ich kann mir nicht vorstellen, dass es viel tun wird, aber anstelle von counter = counter + 1, können Sie Counter + = 1 – cMcNerlin