Ich habe 1000 Geo-Punkte (lat, lang) als Ausgangs-/Zielpunkte. Es gibt auch historische Daten, die die Reisekosten zwischen einigen der O-D-Paare zeigen. Für einige der O-Ds gibt es keinen Datensatz in dem Datensatz und einige haben mehrere Datensätze mit unterschiedlichen Kosten (z. B. aufgrund von Saisonabhängigkeit).Clustering Ursprungs/Zielpunkte
Ich möchte diese 1000 Punkte auf ein paar Cluster (z. B. 20) nicht nur basierend auf ihrem Standort (lat, long), sondern auch unter Berücksichtigung der durchschnittlichen Reisekosten und geteilten Zielpunkte gruppieren.
Ich freue mich, wenn Sie mich wissen lassen könnten, wenn Sie Vorschläge zum Clustering dieser Daten haben.
Dies ist unterspezifiziert. Legen Sie sie in zufällige Partitionen. (Oder ein Qualitätsziel formalisieren) –