2016-07-29 3 views
4

Ich möchte R verwenden, um die Korrelation von Daten einer Variablen [1] zu vielen anderen Variablen data [2:96]Wie korrelieren und gegen Korrelation einer Variablen zu visualisieren viele

Ich bin schon bewusst, zu visualisieren und berechnen von welchen Paketen wie Psych und PerformanceAnalytics die Pairs Funktion haben.

Idealerweise würde ich gerne ein Diagramm wie Pairs outputs ausgeben, aber nur für die Korrelationen zwischen Daten [1] und jedem der Daten [2:96], nicht für jedes Element der Daten [1:96 ] mit sich selbst, das würde zu viel Platz einnehmen. Irgendwelche Ideen dazu würden geschätzt.

+0

Dieser Beitrag könnte Ihnen einige Ideen geben: http://stackoverflow.com/questions/5453336/plot-correlation-matrix-into-a-graph – Warner

+0

Danke, obwohl die meisten von denen sind wieder nxn, während ich suche 1xn. – dorien

Antwort

1

Sie auch Teilmengen abrufen können der Korrelationsmatrix, um dies zu lösen. Zum Beispiel gibt cor(data)[,1] die Korrelationen zwischen Spalte 1 und allen anderen an.

3

das corrr Paket focus() verwenden kann auf Ihrem Variable der Wahl, dann ggplot2 Paket, um die Ergebnisse zu plotten. Zum Beispiel erhalten/Plot Korrelationen von mpg mit allen anderen Variablen im mtcars Datensatz:

library(corrr) 
library(ggplot2) 

x <- mtcars %>% 
    correlate() %>% 
    focus(mpg) 
x 
#> # A tibble: 10 x 2 
#> rowname  mpg 
#>  <chr>  <dbl> 
#> 1  cyl -0.8521620 
#> 2  disp -0.8475514 
#> 3  hp -0.7761684 
#> 4  drat 0.6811719 
#> 5  wt -0.8676594 
#> 6  qsec 0.4186840 
#> 7  vs 0.6640389 
#> 8  am 0.5998324 
#> 9  gear 0.4802848 
#> 10 carb -0.5509251 

x %>% 
    mutate(rowname = factor(rowname, levels = rowname[order(mpg)])) %>% # Order by correlation strength 
    ggplot(aes(x = rowname, y = mpg)) + 
    geom_bar(stat = "identity") + 
    ylab("Correlation with mpg") + 
    xlab("Variable") 

enter image description here

1

Um die Streudiagramme mit Löss Linien zu erhalten, können Sie das tidyr Paket mit ggplot2 kombinieren. Hier ist ein Beispiel für die Streudiagramme von mpg mit allen anderen Variablen im mtcars Datensatz:

library(tidyr) 
library(ggplot2) 

mtcars %>% 
    gather(-mpg, key = "var", value = "value") %>% 
    ggplot(aes(x = value, y = mpg)) + 
    facet_wrap(~ var, scales = "free") + 
    geom_point() + 
    stat_smooth() 

enter image description here

Weitere Informationen darüber, wie das funktioniert, sehen https://drsimonj.svbtle.com/quick-plot-of-all-variables

Verwandte Themen