Ich bin ratlos. Normalerweise funktioniert read.csv
wie erwartet, aber ich bin auf ein Problem gestoßen, bei dem das Verhalten unerwartet ist. Es ist wahrscheinlich Benutzerfehler meinerseits, aber jede Hilfe wird geschätzt.Read.CSV funktioniert nicht wie erwartet in R
Dies ist die URL für die Datei ist
http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip
Hier ist mein Code, um die Datei zu erhalten, entpacken, und lesen Sie es in:
URL <- "http://nces.ed.gov/ipeds/datacenter/data/SFA0910.zip"
download.file(URL, destfile="temp.zip")
unzip("temp.zip")
tmp <- read.table("sfa0910.csv",
header=T, stringsAsFactors=F, sep=",", row.names=NULL)
Hier ist mein Problem. Wenn ich die Daten-CSV-Daten in Excel öffne, sehen die Daten wie erwartet aus. Wenn ich die Daten in R lese, heißt die erste Spalte eigentlich row.names. R liest in einer zusätzlichen Datenzeile, aber ich kann nicht herausfinden, wo der "Fehler" auftritt, der dazu führt, dass row.names eine Spalte ist. Es sieht einfach so aus, als würden sich die Daten verschieben.
Was jedoch seltsam ist, ist, dass die letzte Spalte in R scheint die richtigen Daten zu enthalten.
Hier sind ein paar Zeilen aus den ersten paar Spalten:
tmp[1:5,1:7]
row.names UNITID XSCUGRAD SCUGRAD XSCUGFFN SCUGFFN XSCUGFFP
1 100654 R 4496 R 1044 R 23
2 100663 R 10646 R 1496 R 14
3 100690 R 380 R 5 R 1
4 100706 R 6119 R 774 R 13
5 100724 R 4638 R 1209 R 26
Irgendwelche Gedanken auf, was ich falsch tun könnte?
Gehen Sie niemals davon aus, dass Excel den Inhalt Ihrer CSV-Datei korrekt darstellt. Öffnen Sie stattdessen die CSV-Datei in einem Texteditor (nicht, dass dies die Ursache Ihres Problems ist, sondern als allgemeine Regel). –
Entfernen Sie das Argument 'row.names = NULL'. – mnel
@ttmaccer - das ist seltsam, Sie müssen nicht auf der Website authentifizieren. Ich habe es gerade aus dem Internet ausprobiert und die Datei automatisch auf meinen Computer heruntergeladen. Ich verwende Chrome. – Btibert3