Ich habe eine Eingabedatei mit etwa 20 Millionen Zeilen. Die Größe der Datei beträgt etwa 1,2 G. Gibt es trotzdem, kann ich die Daten in R darstellen. Einige der Spalten haben Kategorien, die meisten davon sind Zahlen.Riesige Datendateien in R zeichnen?
Ich habe versucht, mein Plot-Skript mit einer kleinen Teilmenge der Eingabedatei über 800K Zeilen, aber obwohl ich über 8G RAM habe, scheint ich nicht in der Lage, alle Daten zu plotten. Gibt es einen einfachen Weg, dies zu tun?
Was hoffen Sie in einem Grundstück mit 20 Millionen Datenpunkten zu sehen? – Chase
Unabhängig von der Rechenkapazität müssen Sie Ihre Daten über Histogramme, 1D- und 2D-Dichtediagramme, Hexbin-Plots, ... –
... weiter unten entlang der Linie von @ Paul Hiemstras Antwort unten - wenn Sie etwas geben mehr Details über (eine Teilmenge von) Ihren Daten erhalten Sie vielleicht eine interessante Diskussion über Visualisierungsmöglichkeiten hier. Außerdem ist 'ggplot' möglicherweise langsamer/speicherhungriger als andere Möglichkeiten, wenn Sie wirklich jeden Punkt grafisch darstellen möchten. –