2015-09-16 6 views
6

Ich versuche, eine (etwas) große Datenmenge in ein R-Paket aufzunehmen. Ich erhalte die Warnung bei der Prüfung in Rstudio sagen, dass ich Raum mit Kompression retten könnte:Wie komprimiere speichert in R-Paket Build

* checking data for ASCII and uncompressed saves ... WARNING 

    Note: significantly better compression could be obtained 
     by using R CMD build --resave-data 
      old_size new_size compress 
    slp.rda 499Kb 310Kb bzip2 
    sst.rda 1.3Mb 977Kb  xz 

I -- resave-data zu RStudio des „Configure Buid Tools“ zu keinem Effekt Hinzufügen ausprobiert habe.

enter image description here

Antwort

5

Die devtools Funktion use_data nimmt einen Parameter für die Art der Komprimierung und macht pkgs viel einfacher im allgemeinen Hinzufügen von Daten. Verwenden Sie es oder nur save auf eigene Faust), verwenden Sie xz Komprimierung, wenn Sie Ihre Daten speichern (für save ist es der compression_level Parameter).

Wenn Sie --resave-data dann können Sie --resave-data=best versuchen, da nur mit --resave-data standardmäßig gzip (gewinnt man so ziemlich nichts in diesem Fall) verwenden möchten.

Weitere Informationen finden Sie unter Building package tarballs.

+1

Danke für Ihre Antwort - Ich habe 'save' mit Kompression versucht. Der Komprimierungsfehler ist jetzt weg, aber jetzt bekomme ich die Warnung: 'Warnung: Paket benötigt Abhängigkeit von R (> = 2.10)'. Irgendeine Erfahrung damit? –

+3

Das liegt an der zusätzlichen Komprimierung. Füge 'R (> = 2.10)' zu deiner 'DESCRIPTION' Datei hinzu. – hrbrmstr

0

Eine andere Alternative, wenn Sie eine große Datenmenge haben, die Sie nicht neu erstellen möchten, ist tools::resaveRdaFiles innerhalb von R. Zeigen Sie es auf die Dataset-Datei oder das gesamte Datenverzeichnis, und es wird komprimiert Daten in einem Format Ihrer Wahl. Weitere Informationen finden Sie unter manual page.

Verwandte Themen