2016-04-21 3 views
2

New zu Python und Programmierung im Allgemeinen:Was ist der Unterschied zwischen kondensierten und redundanten Distanzmatrizen?

die Dokumentation wird folgendes squareform:

Wandelt eine Vektor-form Abstandsvektor an eine squareform Abstand Matrix und umgekehrt.

Konvertiert ein 1D-Array in eine quadratische Matrix?

Wo der Paramenter X:

entweder eine kondensierte oder redundante Abstandsmatrix.

und kehrt:

Wenn ein kondensierter Abstandsmatrix übergeben wird, ist ein redundanter ein zurückgegeben, oder wenn ein redundanter einer übergeben wird, ein kondensierter Abstandsmatrix ist zurückgegeben.

  1. was ist der Unterschied zwischen kondensiert und redundante Matrizen?
  2. Was ist die Beziehung zwischen kondensierten/redundanten Matrix und Vektor/Quadratform, in der es dauert?

Die Rückkehr von pdist Papiere kondensierter Abstandsmatrix zurückzukehren:

Gibt eine kondensierte Abstandsmatrix Y. Für jedes i und j (wobei i als j kleiner ist kleiner als n), wird die Metrik dist (u = X [i], v = X [j]) berechnet und im Eintrag ij gespeichert.

Habe ich recht damit, dass Y in jedem Element den Abstand zwischen einem bestimmten Punkt und einem anderen Punkt speichert? Ein Beispiel mit 3 Beobachtungen würde eine kondensierte Matrix mit 9 Elementen bedeuten?

+0

Wird, http://StackOverflow.com/Questions/13079563/how-does-condensed-distance-matrix-work-pdist aussehen wie ein Duplikat Ihrer Frage? –

+0

@WarrenWeckesser verwandt aber anders, stackoverflow.com/questions/13079563/Die Begriffe, die ich als selbstverständlich erachte, nehmen die Frage an? Es sei denn, ich vermisse etwas. –

Antwort

0

Wenn Sie eine nxn-Matrix haben, dann existiert jede paarweise Kombination aus der Menge N zweimal, einmal in jeder Reihenfolge, ab und ba. Wenn Sie also eine Abstandsmatrix aus einer Menge von N Punkten erstellen, können Sie die Daten verdichten, indem Sie jeden Punkt nur einmal speichern und Vergleiche zwischen Punkten und sich selbst vernachlässigen.

zum Beispiel, wenn wir die Punkte a, b und c haben wir die Distanzmatrix

a b c 
a 0 ab ac 
b ba 0 bc 
c ca cb 0 

und die kondensierte Abstandsmatrix,

a b c 
     ab ac 
       bc 

Da Abstand Maser ist unsigned die kondensierte hätten Tabelle enthält alle Informationen.

+0

@kkpie "Entfernung Maser sind unsigned" Was bedeutet das? –

+1

ist der Vektor von a nach b antiparallel und gleich groß wie der Vektor von b nach a. Dies bedeutet, dass sie das entgegengesetzte Vorzeichen und das gleiche Maß oder die gleiche Größe in dem durch ihre Richtung definierten 1-dimensionalen Vektorraum haben. – kpie

+1

@Will der Abstand zwischen 2 Dingen ist ein Maß, das die Reihenfolge des Paares vernachlässigt. – kpie

Verwandte Themen