Ich habe knn Algorithmus für meinen Datensatz entwickelt. Mein Datensatz enthält 5000 * 17 Werte. In diesem Datensatz teile ich meine Daten als 4000 für die Validierung und 1000 für das Training. Meine Frage ist am Ende mein Fehlerprozentsatz ist 0.0158 für Trainingsdaten. Bedeutet es, dass mein Algorithmus gut ist für kn ODER habe ich einen Fehler gemacht? Was denkst du für meinen Algorithmus?knn Algorithmus Fehler Prozentsatz
Antwort
Dies ist zu lang für einen Kommentar.
Die Bewertung von k-NN auf dem Trainingssatz ist ziemlich gefährlich, es sei denn, Sie tun es richtig. Der Grund ist, dass jedes Element sein eigener nächster Nachbar ist. Daher betrügt der Algorithmus.
Sie geben nicht an, was "k" ist. Offensichtlich ist, wenn k = 1, der nächste Nachbar der Gegenstand selbst (oder vielleicht ein Gegenstand mit denselben Schlüsselwerten).
Wenn Sie also den Code selbst schreiben, sollten Sie ihn für jede Trainingsinstanz aus der Gruppe der Nachbarn ausschließen. Sie können dies manuell tun. Oder Sie können einfach den Algorithmus im Validierungssatz auswerten und die Ergebnisse im Trainingssatz ignorieren.
Eigentlich sollten Sie für keinen Algorithmus den Trainingssatz für die Validierung verwenden, wenn dies möglich ist.
Eigentlich habe ich den Punkt selbst nicht aufgenommen, indem ich seine Werte jedes Mal ändere. Ich finde nur k-Punkte, die minimale Abstände zum aktuellen Punkt haben. Ich gebe Werte basierend auf den Werten dieser k Punkte. Ich bekomme nur einen kleineren Fehler im ersten Lauf und es macht mich misstrauisch gegenüber meinem Algorithmus. – Muaa2404
@ Muaa2404. . . Denk darüber nach. Die Entfernung von einem Punkt in dem Trainingssatz zu sich selbst ist 0, so dass er immer in den nächsten Nachbarn enthalten ist (oder zumindest ein Kandidat, wenn es Bindungen gibt). Das ist Betrug. –
- 1. Fehler bei knn Funktion
- 2. Ist kNN ein statistischer Klassifikator?
- 3. Fehler in Algorithmus und Algorithmus
- 4. Chrome (Webkit) Steigung Prozentsatz Fehler
- 5. C# Algorithmus zum Tönen einer Farbe ein bestimmter Prozentsatz
- 6. OpenCV's KNN Unbekannte Klassifikationen
- 7. Grenzentscheidung mit knn-classifier
- 8. Wahrscheinlichkeitsalgorithmus Prozentsatz
- 9. Sklearn kNN Verwendung mit einer benutzerdefinierten Metrik
- 10. Javascript Algorithmus Fehler 3
- 11. Fehler in Heapsort-Algorithmus
- 12. k-nächsten Nachbarn (KNN) Algorithmus in S & P 500 Index mit Python implementiert
- 13. Wie kann ich knn Algorithmus parallel mit r für eine Multi-Klassifizierung
- 14. KNN-Klassifizierung mit kategorischen Daten
- 15. KNN mit R - in Produktion
- 16. Merkmalsauswahl & wichtige Funktionen in kNN
- 17. Unerklärlicher Prozentsatz Fehler Berechnung Französisch Roulette Schätzungen
- 18. Fehler - Prozentsatz bei Verwendung von Linq berechnen
- 19. Prozentsatz ausdrücken
- 20. Plotten eines KNN-Klassifikationsgraphen für mehrere Funktionen
- 21. Fps Algorithmus Fehler mit Systemzeit
- 22. Schwache Cryptography (gebrochen Algorithmus) Fehler
- 23. Shortest Path Algorithmus js Fehler
- 24. Johnson C++ - Algorithmus Kompilierung Fehler
- 25. AES-Algorithmus Fehler in C#
- 26. Berechnung Prozentsatz der Prozentsatz in SSRS
- 27. Probleme mit der KNN-Implementierung in TensorFlow
- 28. Verwechseln mit Sklearn Abstand Algorithmus
- 29. Wie KNN mit Matlab implementieren und die prozentuale Genauigkeit berechnen
- 30. Zeichnen von Match-Paaren im Bild - berechnet von KNN und der potentielle Fehler in Features2DToolbox.DrawMatches
Ich nehme an, Ihr Fehlerprozentsatz ist 1,58%? Wenn es 0,0158% wäre, wäre das ein fantastisches Ergebnis. Ich würde sagen, 1,5% ist ein sehr gutes Ergebnis, aber es hängt ein wenig von den Daten und der Anwendung ab. –