2016-06-02 5 views
-3

Es wird versucht, Analysen für WB-Daten (in .xlsx-Form) auszuführen, die Daten sind jedoch nicht für eine Regression bereit. Derzeit enthält jede Zeile Daten zu einem anderen Land, und jede Spalte enthält Daten für ein bestimmtes Jahr.Weltbankdaten umformen

Idealerweise möchte ich eine neue Tabelle/Datentabelle aus drei Spalten erstellen: Country, Year und MeanValue. Jede Zeile von MeanValue würde dem Mittelwert für jede Jahrespalte auf dem Originalblatt entsprechen.

Kann mir jemand in die richtige Richtung zeigen? Vielen Dank.

Antwort

0

Vielleicht möchten Sie einen Blick auf das Paket wbstats werfen (ich denke, es gibt andere, die den Erhalt von Weltbankdaten erleichtern). Auf diese Weise können die Daten direkt in R. Zum Beispiel zugreifen können, zu Marktpreisen in Dollar aktuellen US 2000-2016 Daten für alle Länder auf GPD zu erhalten: benötigen

dt <- wbstats::wb(indicator = "NY.GDP.MKTP.CD", startdate = 2000, enddate = 2016) 

Dazu einfach in die Spalten auswählen Sie behalten möchten, zum Beispiel dplyr wie folgt aus:

library(dplyr) 

dt <- tbl_df(dt) 
dt %>% arrange(country, date) %>% select(country, date, value) 
Source: local data frame [3,441 x 3] 

     country date  value 
     (chr) (chr)  (dbl) 
1 Afghanistan 2001 2461666315 
2 Afghanistan 2002 4128818042 
3 Afghanistan 2003 4583648922 
4 Afghanistan 2004 5285461999 
5 Afghanistan 2005 6275076016 
6 Afghanistan 2006 7057598407 
7 Afghanistan 2007 9843842455 
8 Afghanistan 2008 10190529882 
9 Afghanistan 2009 12486943506 
10 Afghanistan 2010 15936800636 
..   ... ...   ... 

ich bin nicht sicher, was Sie wollen, wenn Sie auf den Mittelwert beziehen, denn wenn Sie eine Zeile für jedes Land und Jahr dann halten dort isn Es gibt nichts, womit man den Mittelwert annehmen könnte.