2016-06-19 15 views
-2

Hier ist meine CSV-Datei, die ich verwende.So finden Sie den Mittelwert einer Spalte in R

my.xldataset <- read.csv('http://www.math.smith.edu/sasr/datasets/help.csv') 

Hier ist mein Versuch, den Mittelwert der Spalte "MCS1" zu finden.

mean(my.xldataset$mcs1) 

Alles, was ich bekomme, ist eine "NA". Wo genau gehe ich hier falsch? Danke

+0

Wie gesagt @akrun, Sie Haben Sie 'NA'-Werte in Ihrem Datenrahmen, so müssen Sie' na.rm = TRUE' verwenden. – Miha

+2

'help (mean)' hätte Sie auch zur Antwort geführt. –

Antwort

1

Es könnte sein, dass es NA Werte in der Spalte ist, so verwendet na.rm=TRUE

mean(my.xldataset$mcs1, na.rm=TRUE) 

oder es könnte sein, dass die Säule nicht numeric ist. In diesem Fall prüfen die

str(my.xldataset) 

oder

class(my.xldataset$mcs1) 

Durch den Datensatz überprüft,

any(is.na(my.xldataset$mcs1)) 
#[1] TRUE 

die NA Elemente in der Tat in dem Datensatz sind. Verwenden Sie also die na.rm=TRUE.

1

Wie @akrun festgestellt, ist es wahrscheinlich wegen NA in dieser Spalte von Daten. Sie können auch laufen:

summary(my.xldataset$mcs1) 

die min berichten, max, Median, etc ... Quartile sowie geben Sie die Anzahl der der NA :)

Min. 1st Qu. Median Mean 3rd Qu. Max. NA's 
    6.677 30.210 42.440 40.980 52.730 69.940  207 
+0

Warum die Downvotes? Der Mittelwert ist in der Ausgabe von summary() aufgeführt. Die Ausgabe wird oben veröffentlicht. Es liefert nicht nur den Mittelwert, sondern auch NA und meldet die Anzahl der NAs. Wie beantwortet dies die Frage des OP nicht? – akaDrHouse

+0

Sie haben Recht. 'Zusammenfassung' enthält den Mittelwert. Ich habe meine Down-Abstimmung entfernt. –

Verwandte Themen