2017-01-24 2 views
-1

Ich benutze sklearn für maschinelles Lernen. Wenn ich es richtig herausgefunden habe, arbeitet der Fließkomma-Typ in Python mit doppelter Genauigkeit. Arbeitet sklearn intern mit der gleichen Präzision? Ich gebe Daten an sklearn in Listen/numpy Arrays mit Floats (ist das überhaupt relevant?).Arbeiten Sklearn-Algorithmen intern mit doppelter Genauigkeit?

Muss ich mich wegen der Fehlerausbreitung Sorgen machen? Ich denke ich nicht, wenn doppelte Genauigkeit verwendet wird.

Ich möchte nur sicherstellen.

Antwort

1

sklearn scheint nicht anzugeben, wie es intern in Bezug auf Datentypen funktioniert. Es ist jedoch wahrscheinlich sinnvoll, davon auszugehen, dass die Genauigkeit des Eingabedatentyps mindestens beibehalten wird. Also, um auf der sicheren Seite zu sein, geben Sie wahrscheinlich dtype als doppelt in Ihren Daten an.

In der Praxis sollte die Fehlerfortpflanzung kein Problem sein, da die meisten Algorithmen approximativ sind und einige von ihnen viel mehr von den zufälligen Anfangsbedingungen als von der Genauigkeit abhängen. Kürzlich gibt es sogar den Vorschlag, dass wir Genauigkeit Genauigkeit Ressourcen sparen sollten, da der Einfluss gering ist. Siehe zum Beispiel https://arxiv.org/pdf/1502.02551.pdf

Verwandte Themen