Ich habe einen Datenrahmen mit einer großen Anzahl von Breitengrad/lon Punkten (305000). Ich möchte die Größe meines Datenrahmens reduzieren, indem ich für jede Iteration eine Stichprobe nehme und den Abstand zwischen den aufeinanderfolgenden Zeilen berechnet. Wenn die Entfernung zu klein ist, möchte ich einen der beiden Punkte löschen. Wie kann ich das in Python machen? Ich wollte shift() verwenden, aber ich weiß nicht, wie man es benutzen kann. Das versuche ich.reduzieren lat lon Punkte
rows=random.sample(df.index,50)
for i in range(50):
rows = np.random.choice(df.index.values, 1000)
sampled_df = df.ix[rows]
if haversine(sampled_df,sampled_df.shift()) < e
delete one row