2017-11-28 9 views

Antwort

0

Das DBSCAN-Papier schlägt vor, MinPts basierend auf der Dimensionalität und Eps basierend auf dem Ellenbogen im K-Abstand-Diagramm auszuwählen.

In der jüngeren Veröffentlichung

Schubert, E., Sander, J., Ester, M., Kriegel, H. P., & Xu, X. (2017).
DBSCAN Revisited, Revisited: Warum und wie Sie (noch) DBSCAN verwenden sollten.
ACM Transaktionen auf Datenbanksysteme (TODS), 42 (3), 19.

die Autoren schlagen vor, einen größeren MinPts für große und laute Datensatz zu verwenden, und epsilon anzupassen, je nachdem, ob Sie zu großen Clustern erhalten (verringern Sie Epsilon) oder zu viel Geräusch (erhöhen Sie Epsilon). Clustering erfordert Iterationen.

Dieses Papier war eine interessante Lektüre, weil es zeigt, was schief gehen kann, wenn Sie nicht auf Ihre Daten schauen. Die Leute sind zu sehr mit Leistungsmetriken beschäftigt und vergessen, die tatsächlichen Daten zu betrachten.

Verwandte Themen