Ich habe einen hierarchischen Cluster für ein Projekt. Ich habe 300 Beobachtungen von 20 Variablen. Ich indizierte alle Variablen, so dass jede Variable zwischen 0 und 1 liegt, ein größerer Wert ist besser.Wie Knoten Beschriftungen von Dendrogramm Plot zu ändern
Ich habe den folgenden Code verwendet, um ein Cluster-Diagramm zu erstellen.
Jetzt sind die Beschriftungen der Knoten in Zeilennamen, die Nummern 1 bis 300 (siehe Bild oben). Während der Analyse habe ich die erste Spalte des Datenrahmens entfernt, die mit "Geographie" gekennzeichnet ist (siehe unteres Bild), weil es sich um Stadtnamen im Text handelt, die die Analyse zunichte machen würden. Aber ich wirklich müssen die Stadtnamen auf dem Cluster-Plot an ihren richtigen Stellen zu bekommen, weil ich eine Liste der Städte basierend auf den Ergebnissen wählen muss.
Welchen Code soll ich schreiben, um die Stadtnamen in die "geography" -Spalte einzufügen, die ihren Zeilennamen entsprechen?
Wie Sie aus dem Datenrahmen (unteres Bild) sehen können, sind alle Städtenamen in alphabetischer Reihenfolge, sauber in aufsteigender Reihenfolge, genau wie die Zeilennamen. Ich bin mir sicher, dass es nicht schwer ist, die Stadtnamen auf die Handlung zu setzen, ich kann es einfach nicht finden, indem ich googele und herum frage.
Bitte verwendet reproduzierbaren Code zur Verfügung zu stellen, bereit zu-Paste-run zu kopieren, ist es einfacher für die Besucher und Leser zu machen. (ZB 'all_data' wird nicht angegeben; Screenshots von Datensätzen sind nicht hilfreich; das Ergebnis von' dput (my_data) 'ist der richtige Weg.) – lukeA
danke für den Rat, ich werde das in Zukunft üben – Elan
[Warum Verbessere deine Frage jetzt nicht] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)? – Jaap