Ich bemerke ein Problem, bei dem das pdftools-Paket in R scheint, anders als lokal auf meinem Windows 7-Computer auszuführen, wenn ich es auf einem gemeinsamen Ubuntu-Server über ssh ausführe.pdftools in R, die auf Maschinen unterschiedlich sind
Mein Code:
download.file("http://www.nber.org/lbid/docs/LinkCO95Guide.pdf",
"1995codebook.pdf",
mode = "wb",
method = "libcurl")
codebook <- pdf_text("1995codebook.pdf")
Auf meinem lokalen Windows-7-Maschine, das Objekt Codebuch wie zeigt sich "Großzeichen (258 Elemente, 710.2 Kb)", während auf dem Ubuntu-Server zeigt es sich als "Großer Charakter (258 Elemente, 701,9 Kb)".
Wie Sie sich vorstellen können, verursacht dies Probleme für mich Downstream, wo Code, der auf meinem lokalen Rechner funktioniert, nicht die gleichen Ergebnisse auf dem Ubuntu-Server produziert. Betrachtet man den Text in Codebuch der erste Unterschied, den ich sofort bemerke, ist, dass, wo die Version unter Windows produziert hat "\ r \ n" die auf Ubuntu produzierte Version nur "\ n" hat (ich verlasse mich auf "\ r \ n "stromabwärts".
Warum sollte diese Zeichenserie anders sein? Könnte es etwas mit Codierung zu tun haben? Jede Hilfe wird geschätzt, was das verursacht und wie ich die gleichen Ergebnisse auf beiden Maschinen erzielen kann.
Eine letzte Sache zu erwähnen: Ich hatte die poppler Bibliothek zu meinem Home-Verzeichnis auf dem Ubuntu-Server zu installieren, um (nicht sudo Zugang haben) zu pdftools erhalten zu installieren:
apt-get source poppler
cd poppler-0.24.5
./configure --prefix=$HOME/myapps
make
make install
export PKG_CONFIG_PATH=$HOME/myapps/lib/pkgconfig
Nach getan, scheint install.packages ("pdftools") korrekt zu laufen. Und pdftools lädt ohne Problem. Also, wenn es eine schlechte Installation ist, bin ich mir nicht sicher, was schief gelaufen ist.
Jede Diskrepanz kann B/C der Poppler-Bibliothek in Verwendung oder Codierung Probleme sein. Was haben Sie gemacht. Was ist das Dokument? Wo ist der reproduzierbare Code, den Sie erhalten haben, als Sie ein q eingereicht haben? – hrbrmstr
Danke für die Antwort. Das Dokument befindet sich im obigen R-Code. Das ist der Code, der für die Reproduktion in R benötigt wird, außer install.packages ("pdftools") und library (pdftools). Der Code, den ich verwendet habe, um die Poppler-Bibliothek zu bekommen, war: apt-get source poppler; cd poppler-0.24.5; ./configure --prefix = $ HOME/myapps; machen; make installieren; Export PKG_CONFIG_PATH = $ HOME/myapps/lib/pkgconfig; – lost