Ich habe ein paar Probleme mit dem Versuch, Schleifen in Dask zu implementieren. zum Beispiel in dem folgenden Code:DASK Dataframe in Schleifen
for i in range(len(col)):
if df[col[i]].dtype=='object':
pass
elif df[col[i]].std().compute()==0:
cols_constant.append(col[i])
df = df.drop(cols_constant,axis=1)
Der gleiche Code ist sehr schnell Pandas verwenden, aber auf dask ist es eine beträchtliche Menge an Zeit zu nehmen, um die Aufgabe abzuschließen.
Ich verstehe Dask ist ineffiziente Überschleifen. Aber wie kann ich meinen Code für Dask für ähnliche Funktionen optimieren?
Ich kann e.persist() nicht verwenden, da wir beabsichtigen, die Berechnung auf mehreren Worker-Systemen durchzuführen.
Wird es nützlich sein, die Funktion 'dask.do' zu verwenden, um die gleiche Aufgabe zu parallelisieren?