Warum kann die Verwendung von angepasstem Rand-Index (ARI) und normalisierter gegenseitiger Information (NMI) in Cluster-Methoden zu einer besseren Messung als einfache Testergebnisse (wie MSE) führen? Ich verstehe, dass welcher Punkt zu welchem Cluster in Clustering-Algorithmen wichtig ist, und Beschriftung ist beliebig.adjusted rand index (ARI)
Antwort
Sie haben selbst geantwortet - es gibt kein "MSE" für Clustering, da MSE nur definiert ist, wenn Sie den Wert Wert der abhängigen Variablen kennen. Beim Clustering wird es nicht nur willkürlich zugewiesen, sondern es gibt auch nicht das Konzept einer "Zahl", und MSE ist Regressionsmetrik, es arbeitet mit Zahlen, nicht mit Klassen. Nun, warum nicht einfach Accuracy verwenden, indem einfach alle möglichen Permutationen der Etikettierung berechnet werden? Nun, das ist (fast) genau das, was RandIndex ist, obwohl es in der anderen Gesellschaft entstanden ist und einen anderen Namen hat, es ist sehr eng verwandt mit der Zuordnung zwischen Cluster und Label. Was ist der Adjusted Rand Index? Nichts als RandIndex/(fast) Accuracy mit einer Korrektur, die Ihnen sagt, wie sich ein völlig zufälliger Classifier verhält. Es ist also buchstäblich eine Transformation der Genauigkeitsmetrik, normiert durch die Genauigkeit eines zufälligen Klassifikators.
nehmen diese „kleine Unterschiede“ einfach in Betracht der Tat hat das Clustering einige zusätzliche Eigenschaften wie:
- Anzahl von Clustern (Etiketten) wird Ihnen eine Korrektur nehmen nicht gegeben a priori
- müssen mit triviale Modelle, die leicht schwer sein könnte, um herauszufinden, (für die Einstufung ist es in der Regel sehr einfach zu sagen, was die Genauigkeit der trivialen Modell ist)
Vor allem die ersten Teils Angelegenheiten betrachten Clustering:
clustering [o o o o][o o o o][o o o o ]
truth [o o o o o o o o][o o o o ]
Die einzige "schlechte Sache", die passiert ist, dass wir eine Klasse in 2 Teile aufgeteilt haben. Wenn wir Genauigkeit verwenden wir 75% erhalten (da die eine Hälfte wird einfach als „schlecht“), aber wenn man bedenkt rand Index nehmen, wird es tatsächlich viel höhere Punktzahl zuweisen als für:
clustering [o][o][o][o][o o o o][o o o o ]
truth [o o o o o o o o][o o o o ]
, die mit Genauigkeit würde auch Ausbeute 75%. Und ich würde argumentieren, dass das erste Clustering tatsächlich besser ist als das zweite. Mit anderen Worten, diese Metriken sind eng mit den klassischen Klassifikationsmetriken verwandt, sie führen einfach zusätzliche Aromastoffe ein, um zwischen (größtenteils) Clusterings mit unterschiedlicher Anzahl von Clustern zu unterscheiden. Der Hauptgrund hier ist, dass in Clustering Sie Struktur kümmern, nicht punktweise Etiketten.
- 1. Wie QRectF :: adjusted() funktioniert
- 2. Python, Cosine Ähnlichkeit zu Adjusted Cosine
- 3. ARI JS Client Stumm Fehler
- 4. Suchen UIButton adjusted font size value?
- 5. Können Sie einen Agenten mit Asterisk ARI anmelden
- 6. ARI - wscat Störung zu erhalten: Fehler: Verbindung ECONNREFUSED
- 7. Knoten ARI-Client | Connect Methode nicht Callback auslösen?
- 8. Wie HTTP-Server auf Sternchen für eine ARI-Anwendung aktivieren
- 9. Rand für unteren Rand
- 10. Wie konvertiert man rgba zu einem Transparenz-Adjusted-Hex?
- 11. FF unerwünschte Rand anzeigen
- 12. transparentes Dreieck mit Rand
- 13. negativer Rand Ursache Schwebungsunterbrechungen
- 14. Entfernen von Rand/Rand/Füllung aus Formular
- 15. css - Kreis mit Rand am Rand
- 16. Zentrierung div. Rand oben und Rand unten
- 17. Angepasste gegenseitige Informationen (scikit-learn)
- 18. mit Rand
- 19. Warum Rand: Auto; funktioniert nicht?
- 20. PHP - Ist Rand (1,1000) = 1000 so wahrscheinlich wie Rand (1,1000) = Rand (1,1000)?
- 21. UL hat Rand links
- 22. firefox/Safari/ie oberen Rand, linken Rand 0
- 23. Negativer Rand-links funktioniert gut, negativer Rand-rechts erzeugt Bildlaufleiste
- 24. Inhalt der Zelle überfüllt mit Rand, Padding und Rand
- 25. Swing - JTable JScrollPane unteren Rand entfernen oder Header-Rand hinzufügen
- 26. Bootstrap linken und rechten Rand an den Rand eines Bildes
- 27. Icons mit Rand, nebeneinander mit Rand Hover-Effekt
- 28. Bootstrap überlappenden Rand mit Spalten ohne Rand und Padding
- 29. Layout Rand/Padding am oberen Rand des Dialogfragments
- 30. Blättern und Rand CSS Probleme
Vielen Dank für Ihre Erklärung. –