Ich bin neu für R-Programmierung. Ich benutze R 3.4.2 in Mac OS X EI Capitan V10.11.6.Fehler beim Lesen von Wikipedia-Daten mit R und readr
Wenn ich versuchte, Daten von unten URL zu lesen, habe ich Fehler. Kann jemand helfen?
Datenquelle-Link: https://dumps.wikimedia.org/other/pageviews/2017/2017-10/pageviews-20171001-010000.gz
Die Datei vier Felder enthält: Sprache, Wikipedia Seitentitel, Anzahl der Anfragen, die Seite in dieser Stunde erhalten, Gesamtgröße in Byte des Inhalts zurückgegeben. Es ist CSV-Datei durch Leerzeichen ohne Kopfzeile getrennt.
Ich versuchte Tabelle mit folgendem Code zu lesen:
df <- read.table("https://dumps.wikimedia.org/other/pageviews/2017/2017-10/pageviews-20171001-010000.gz", sep = " ", stringsAsFactors = FALSE, header = FALSE, encoding = "UTF-8")
Der Fehler ich habe ist
Fehler in Scan (file = Datei, was = was, sep = sep, quote = Zitat Dez. = dec: Zeile 1 nicht über 2 Elemente Zusätzlich: Warnmeldung: In read.table ("https://dumps.wikimedia.org/other/pageviews/2017/2017-10/pageviews-20171001-010000.gz": Leitung 1 erscheint eingebettet nulls enthalten
Auch ich habe versucht, Readr-Paket zu verwenden, immer noch fehlgeschlagen. Der Code, den ich verwendet, ist unter
df <- read_delim("https://dumps.wikimedia.org/other/pageviews/2017/2017-10/pageviews-20171001-010000.gz", delim = " ", col_names = FALSE)
BTW, wenn ich diese Daten mit Funken scala lesen, gibt es kein Problem.
Zugabe Ausgabe von 'devtools :: session_info()' kann Triage Ursache – hrbrmstr