2016-10-28 2 views
2

Ich kann CSV-Datei verwenden, die eine Spalte hat, aber nicht eine Spalte von vielen Spalte DateiWarum schlägt diese R CSV-Spaltenauswahl fehl?

dataA = read.csv("data.csv", header = FALSE,sep = ",") 
summary(dataA) # works! 

Ausgang: korrekte grundlegende statistische Analyse der Werte (min, 1. Qu, ...). Nun mehrspaltigen Daten, wo ich nur die zweite Spalte verwendet werden soll, so kann ich den folgenden

ID,Age,Gender 
1,2,3 
4,5,6 

-Code, wo dataA[-(1), 2] Header sagt entfernen und nehmen Sie die zweite Spalte

dataA = read.csv("data.csv", header = FALSE,sep = ",") 
dataA = dataA[-(1), 2] 
summary(dataA) # does not work!: 

Ausgang: Werteliste in einer Liste keine statistische Analyse; es scheint, dass die Ausgabe wie eine Zeichenfolge oder etwas ist; Hier ein Beispiel für größere Datensatz

male  5  27.78 
    23 24 32 39 43 47 51 53 54 56 57 59 61 62 63 64 65 66 68 
    2 2 2 2 1 1 1 2 1 1 1 1 1 1 1 2 2 1 1 2 
69 72 73 75 76 77 80 81 83 84 87 89 Age 
    3 2 2 1 1 1 1 1 2 2 2 1 0 

Erwartete Ausgabe wie diese

 V1  
Min. :23.00 
1st Qu.:50.75 
Median :65.00 
Mean :58.33 
3rd Qu.:68.75 
Max. :81.00 

OS: Debian 8.5
R: 3.1.1

+1

Wenn Sie es auf diese Weise lesen, sieht alles wie eine Zeichenfolge aus, Recht? Datentypen sind auf der Ebene der Spalte, nicht die Zelle. – Frank

+1

@Frank Ich habe es in den Körper aufgenommen. –

Antwort

2

Ihre mehrspaltigen Datei hat einen Header, so dass nur tun :

dataA = read.csv("data.csv", header = TRUE, sep = ",") 
dataA = dataA[, 2] 
summary(dataA) 
Verwandte Themen