Ich muss R-Daten effizient über ein Netzwerk abrufen können. Der typische Datensatz, den ich abrufen möchte, besteht aus ein paar hunderttausend Zahlen.Numerische Daten mit reduzierter Genauigkeit
Ich verwende derzeit saveRDS zum Speichern der Daten und readRDS zum Abrufen, was mir eine anständige Leistung gibt. Aber einige der vorberechneten Ergebnisse können aufgrund der Tatsache, dass R jede Zahl in 4 Bytes speichert, immer noch im Dutzenden von MB-Bereichen enden. Für meine Anwendung brauche ich keine genauere Genauigkeit als eine 1 oder höchstens 2 Byte Ganzzahl, also denke ich, dass ich etwas Zeit sparen könnte, indem ich die Binärdaten in einem anderen Format speichern würde.
Ich konnte online nichts über effizientes Speichern von R-Daten in reduzierten Präzisionsformaten finden. Offensichtlich konnte ich in meinem eigenen Binärformat lesen und schreiben, aber ich stelle mir vor, dass der Overhead der Schleife, der das in R erledigt, alle Leistungsvorteile überwiegt, die ich durch die Reduzierung der Lese-/Übertragungszeit über das Netzwerk erreichen würde.
Hat jemand Erfahrung damit?
Danke! 'as.raw' war nicht genug Genauigkeit für mich, aber der' short' Int in deinem Paket mag genau das Richtige! –