Ich habe Code in Python geschrieben, um den DBSCAN-Clustering-Algorithmus zu implementieren. Mein Datensatz besteht aus 14.000 Benutzern, wobei jeder Benutzer durch 10 Funktionen repräsentiert wird. Ich kann nicht entscheiden, was genau als Wert von Min_samples und epsilon als Eingabe Wie sollte ich das entscheiden? Ähnlichkeitsmaß ist euklidischer Abstand (daher wird es noch schwieriger zu entscheiden.) Irgendwelche Hinweise?Eingabewerte für den DBSCAN-Algorithmus definieren
0
A
Antwort
0
DBSCAN ist oft schwer zu schätzen seine Parameter.
Haben Sie an den OPTICS-Algorithmus gedacht? Sie benötigen in diesem Fall nur Min_samples, die der minimalen Clustergröße entsprechen würden.
Ansonsten für DBSCAN Ich habe es in der Vergangenheit durch Versuch und Irrtum getan: einige Werte versuchen und sehen, was passiert. Eine allgemeine Regel, die zu befolgen ist, besteht darin, dass wenn Ihr Dataset laut ist, Sie einen größeren Wert haben sollten und dass dieser auch mit der Anzahl der Dimensionen korreliert (in diesem Fall 10).
Verwandte Themen
- 1. C# Eingabewerte für GradeBook
- 2. Eingabewerte zählen
- 3. svm Skalierung Eingabewerte
- 4. rbprobitGibbs Hilfedokumentation simulierte Eingabewerte?
- 5. Tabelle und Eingabewerte ändern?
- 6. Definieren der Variablen für den SVERWEIS-Code
- 7. Wie definieren Sie den Befehlsnamen für Tastenbelegungen?
- 8. React, Binding Eingabewerte
- 9. Angular2 ang Eingabewerte erhalten
- 10. Angular2-Zugriff Elternkomponente @ Eingabewerte
- 11. AngularJS: Sum Eingabewerte
- 12. Vergleichen der Eingabewerte
- 13. Erhalten Sie Eingabewerte von JComboBox
- 14. initialisieren TabPanel Eingabewerte Shiny R
- 15. Prestashop - AuthController.php empfängt keine Eingabewerte
- 16. Ein Symbol nur für bestimmte Eingabewerte in Squib anzeigen
- 17. jquery validate: Summe mehrerer Eingabewerte
- 18. So fügen Sie Eingabewerte hinzu
- 19. definieren Inkrementoperator für GUID
- 20. Eingabewerte verbergen, wenn der Schieberegler für den Preisbereich während des Gleitens zu Ende geht
- 21. Anzeigename für Modelle definieren
- 22. jquery jede Funktion, um Eingabewerte zu erhalten
- 23. Vergleichen Sie zwei Eingabewerte mit Jquery
- 24. Sollte ich den Primärschlüssel für jede Entität in Realm definieren?
- 25. Wo kann ich den Body für eine private Funktion definieren?
- 26. Definieren der Functor-Instanz für den Tensor-Typ (Idris)
- 27. Änderungsanforderung Eingabewerte aus leeren String in Laravel
- 28. C++ # Makro für Datenprotokollierung definieren
- 29. Shapeless definieren Linse für Basismerkmal
- 30. Prototyp nur für {...} Objekte definieren
Werten Sie die euklidische Distanz auf Ihrem Datensatz aus. Funktioniert es? Was ist eine sinnvolle Ähnlichkeitsschwelle? Verwenden Sie dann diesen Schwellenwert als epsilon für DBSCAN. –
Wie soll ich die euklidische Distanz in meinem Datensatz auswerten? – Maxwell
@ Anony-Mousse: Ich dachte darüber nach: Wäre es sinnvoll, die euklidischen Entfernungen innerhalb von 0-1 zu normalisieren. Jetzt können die Entfernungen bis zu 10k + steigen, was es schwierig macht, die Schwelle zu bestimmen. Aber ich bin mir nicht sicher, wie ich es normalisieren soll. Irgendwelche Ideen? – Maxwell