Antwort

12

Korrelation ist einheitsunabhängig; Wenn Sie eines der Objekte zehn Mal skalieren, erhalten Sie unterschiedliche euklidische Abstände und gleiche Korrelationsabstände. Daher sind Korrelationsmetriken ausgezeichnet, wenn Sie den Abstand zwischen Objekten messen möchten, die durch Expressionsprofile definiert sind.

Oft wird die absolute oder quadrierte Korrelation als Entfernungsmetrik verwendet, weil wir mehr an der Stärke der Beziehung interessiert sind als an ihrem Vorzeichen.

Die Korrelation ist jedoch nur für hochdimensionale Daten geeignet; Es gibt kaum einen Punkt, um es für zwei- oder dreidimensionale Datenpunkte zu berechnen.

Beachten Sie auch, dass "Pearson-Distanz" eine gewichtete Art der euklidischen Distanz ist und nicht die "Korrelationsdistanz", die den Pearson-Korrelationskoeffizienten verwendet.

5

Es hängt wirklich von dem Anwendungsszenario ab, das Sie in der Hand haben. Ganz kurz, wenn Sie mit Daten arbeiten, bei denen der tatsächliche Unterschied in Werten von Attributen wichtig ist, gehen Sie mit Euklidischer Abstand. Wenn Sie nach einer Ähnlichkeit von Trends oder Formen suchen, dann gehen Sie mit der Korrelation. Beachten Sie auch, dass die euklidische Distanz sich ähnlich wie der Pearson-Korrelationskoeffizient verhält, wenn Sie in jedem Objekt eine Z-Score-Normalisierung durchführen. Pearson ist gegenüber linearen Transformationen der Daten nicht empfindlich. Es gibt andere Arten von Korrelationskoeffizienten, die nur die Ränge der Werte berücksichtigen und sowohl für lineare als auch für nichtlineare Transformationen unempfindlich sind. Beachten Sie, dass die übliche Verwendung der Korrelation als Unähnlichkeit 1 - Korrelation ist, die nicht alle Regeln für eine metrische Distanz berücksichtigt.

Es gibt einige Studien, auf denen Näherungsmaß auf eine bestimmte Anwendung auswählen, zum Beispiel:

Pablo A. Jaskowiak, Ricardo Campello JGB, Ivan G. Costa Filho, „Proximity Maßnahmen für Clustering Genexpression Microarray-Daten: Eine Validierungsmethodologie und eine vergleichende Analyse, "IEEE/ACM-Transaktionen auf Computerbiologie und Bioinformatik, vol. 99, nein. PrePrints, p. 1,, 2013

Verwandte Themen