In der Statistik führen wir kaum eine Normalisierung durch. Bei Bedarf zentrieren wir Kovariaten, normalisieren aber nicht. Beim maschinellen Lernen ist insbesondere die Deep-Learning-Feature-Normalisierung vorrangig. Warum ist es wichtig in einigen Anwendungen, aber nicht wichtig in anderen.Feature Normalisierung
Antwort
Für die maschinellen Lernverfahren ist die Skalierung wichtig, da sie die Berechnung der Zielfunktion beeinflussen wird.
Zum Beispiel verwenden viele Algorithmen die euklidische Distanz, um eine Klassifizierung vorzunehmen. Wenn Sie ein Merkmal haben, das viel größere Werte als die anderen Merkmale hat, wird es die Entfernung dominieren und somit werden die Vorhersagen nur von diesem einzigen Merkmal beeinflusst .
Die Skalierung unterstützt auch den Gradientenabstieg (Methode, die in vielen Algorithmen zur Minimierung der Fehlerfunktion verwendet wird), die viel schneller konvergiert. SVMs trainieren auch schneller mit normalisierten Werten.
Zusammenfassend hilft die Verwendung aller Werte auf derselben Skala bei der Berechnung. Meine Vermutung, warum es beim maschinellen Lernen so wichtig und bei Statistiken nicht so wichtig ist, ist, dass Maschinenlernalgorithmen in der Regel Schleifen haben, die oft wiederholen. Bei jeder Iteration beeinflussen die Werte "out of scale" mehr und mehr und dominieren das Modell. Auf der anderen Seite haben statistische Methoden diese Schleifen nicht, so dass die Skalierung sie nicht so stark beeinflusst.
- 1. Merkmal Normalisierung- Vorteil der Normalisierung l2
- 2. Datenbank Normalisierung
- 3. String Normalisierung
- 4. SQL Normalisierung
- 5. BCNF Normalisierung
- 6. MinMax Normalisierung in Scala
- 7. Wahrscheinlichkeit Normalisierung in Python
- 8. Normalisierung in sql
- 9. Audio Normalisierung/Fixierung?
- 10. Datenbank Tabelle Normalisierung
- 11. Datenbank Normalisierung mehrere Wiederholungen
- 12. Bild Mittlere Normalisierung
- 13. Normalisierung in Cassandra
- 14. Normalisierung eliminieren überflüssige Attribute
- 15. Normalisierung vs Kompression
- 16. Lokale Normalisierung in OpenCV
- 17. MySQL/PHP Datenbank Normalisierung
- 18. Herz BPM Normalisierung - Matlab
- 19. bedeuten MFCC Normalisierung
- 20. Normalisierung auf 3NF
- 21. Normalisierung in columnar dbs
- 22. Normalisierung mit Double
- 23. Über Normalisierung in Redux
- 24. Normalisierung vermisst polnische Zeichen
- 25. Normalisierung Online Warenkorb Tabelle
- 26. Label-Normalisierung in Deep-Regressions-Netzwerken
- 27. MongoDB Normalisierung vs Denormalisierung für mein Szenario
- 28. Gleiche Feature-Wert für alle entsprechenden Feature
- 29. Kann Gurken Feature Feature nicht ausführen
- 30. Feature Auswahl auf Teilmengen von Feature-Set