Ich weiß, dass DBSCAN zwei Parameter (MinPts und Eps) benötigt. Ich bin jedoch verwirrt darüber, welche Parameter für OPTICS benötigt werden, da einige Quellen sagen, dass es eps benötigt, während andere sagen, dass es nur minPts benötigt.DBSCAN vs OPTICS für automatische Clustering
Welcher Algorithmus wäre besser zu verwenden, wenn ich automatisch die Parameterwerte ermitteln würde, die Ausreißer am besten verwerfen würden?
Eines der Konzepte, die ich für den OPTICS-Algorithmus verwirrt habe, ist, wie man automatisch die Erreichbarkeit zur Minimierung von Rauschen bestimmt? – user3315340
Das Papier definiert zwei Entfernungen, die für die Entfernung von Rauschen relevant sind: Die Kernentfernung eines Punkts (Objekts) p, die Entfernung zwischen ihm und dem nächstgelegenen Punkt, der die Anzahl der vom Raum eingeschlossenen Punkte zu minPts zulässt. Dann gibt es die Erreichbarkeitsdistanz von zwei Punkten p und o (o ist der Ursprung des Clusters), welches das Maximum entweder der Kernentfernung von o oder der Entfernung zwischen o und p ist (d (o, p) kann kleiner sein als der Kernabstand von o). Siehe Abbildung 4 des Papiers für eine Illustration. – Dylon
Ein Objekt wird als Rauschen klassifiziert, wenn für einige Eps <= Eps die Erreichbarkeitsdistanz> Eps und seine Kerndistanz> Eps ist. Abbildung 8 des Papiers beschreibt den Algorithmus dafür im Detail. – Dylon