Die lineare Regression funktioniert nicht, wenn die Anzahl der Features größer als die Datasetgröße ist. sofern keine Regularisierung angewendet wird. Hat SVM auch ähnliche Probleme? Wird es keine gute Annäherung geben, wenn die Anzahl der Beispiele im Vergleich zur Dimensionalität der Merkmale geringer ist? Sagen Sie, wenn die Beispiele 1/10 oder 1/100 der Features sind ??Wenn die Anzahl der Features viel größer ist als die Anzahl der Beispiele im Dataset funktioniert SVM immer noch?
0
A
Antwort
0
Wenn die Anzahl der Beispiele im Vergleich zur Anzahl der Features geringer ist, hätten Sie nicht genügend Daten für eine nichtlineare SVM, dh SVM mit nicht linearem Kernel. Eine SVM mit linearem Kernel (oder ohne Kernel) ist eine Möglichkeit gehen.
Wenn Sie eine nichtlineare SVM verwenden möchten, müssen Sie die Kernelparameter und Regularisierungsparameter sorgfältig auswählen und sie richtig einstellen.
Was ich meine ist, dass es kein inhärentes Problem mit der Verwendung einer SVM (oder anderer regulierten Modelle) auf ein Problem mit Hunderten von Beobachtungen und Tausenden von Attributen gibt, vorausgesetzt die Regularisierungsparameter sind richtig abgestimmt.
Verwandte Themen
- 1. Warum ist die Anzahl der "abgerechneten" Instanzen so viel größer als die Anzahl der "aktiven" Instanzen?
- 2. Anzahl xlabel größer ist als die Länge der Daten
- 3. Wenn die Anzahl der Eigenschaften größer als n ist, kehrt die Pfade in Neo4j
- 4. den gesamten Inhalt der Variablen drucken, wenn die Anzahl der Zeilen größer ist als N
- 5. Valueerror: Kann nicht haben Anzahl der Faltungen n_folds = 3 größer als die Anzahl der Proben: 2
- 6. Rails ActiveRecord distinct Anzahl der Attribute größer als die Anzahl der Vorkommen
- 7. PHP/MySQL, wenn die Anzahl der Zeilen größer als 6400 ist, gibt keine Ergebnisse zurück
- 8. Wenn die Anzahl der Eigenschaften größer als n ist, geben Sie einen Untergraphen in Neo4j zurück
- 9. Berechne die Anzahl der Monate von der Anzahl der Tage
- 10. Anzahl der Entitäten immer gleich der Anzahl der Datenbanktabellen?
- 11. Wird die Anzahl der erkannten Features in SIFT erhöht, um die Präzision zu erhöhen?
- 12. Undefinierter Versatzfehler im Array, wenn Anzahl die Anzahl der Elemente im Inneren zeigen
- 13. Berechnung der Anzahl von 2-3 Bäumen, wenn die Anzahl der Knoten gegeben ist
- 14. Wie ist die Anzahl der Ansichten begrenzt?
- 15. Immer wenn die erste Nummer größer ist, funktioniert es nicht
- 16. Die Anzahl der Parameter im Gaußschen Mischmodell
- 17. SELECT-Abfrage, wenn die Anzahl der Bedingungen nicht behoben ist?
- 18. Anzahl der Zeiten, die Element im Array erscheint
- 19. SQL Concat-Funktion nur, wenn die Anzahl der Zeilen kleiner als die Anzahl
- 20. Die Anzahl der Elemente im Array zählen
- 21. Wie update aufzeichnen, wenn die Anzahl der gesamten Datensätze größer als 50 in PostgreSQL
- 22. Distinct Anzahl der Wochen, in denen die Summe größer als 0 ist. PowerPivot
- 23. Wie die Anzahl der Zeilen im Quellcode
- 24. Terraform versucht immer noch, die Interpolation in der Ressource mit der Anzahl Null aufzulösen
- 25. „Liste“ der Zähler größer ist als die Anzahl von Elementen innerhalb des
- 26. regex eine beliebige Anzahl entsprechen, die größer als 5
- 27. die Anzahl der Reduzierung, wenn Aussagen
- 28. Ist input = „phone“ begrenzen die Anzahl der Ziffern als inout
- 29. Anzahl der Features des Modells muss mit der Eingabe übereinstimmen
- 30. Führt der Trainingsschritt die Anzahl der Iterationen im neuronalen Faltungsnetzwerk?
Diese Frage wäre bei [Cross Validated] (http://stats.stackexchange.com/) viel passender. Wenn Sie jedoch dort posten, kann es am Ende als doppelt markiert werden, weil eine Post-Liste (http://stats.stackexchange.com/questions/35276/svm-overfitting-curse-of-dimensionality) antworten sollte Ihre Frage. – Tchotchke