Ich bin mir nicht sicher, ob das ein Fehler ist oder nicht. Wenn ich eines der Zeichen in UTF-8 codiere, bevor ich es in raw und zurück umwandle, sind die Zeichen nicht identisch. Ich habe Standardkodierung auf "UTF-8" in RStudio festgelegt.Kodierung und Raw in R
rawToChar(charToRaw(enc2utf8("vægt")))
[1] "vægt"
rawToChar(charToRaw("vægt"))
[1] "vægt"
Hier ist meine Session()
R version 3.2.2 (2015-08-14)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
locale:
[1] LC_COLLATE=Danish_Denmark.1252 LC_CTYPE=Danish_Denmark.1252 LC_MONETARY=Danish_Denmark.1252
[4] LC_NUMERIC=C LC_TIME=Danish_Denmark.1252
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] ggthemes_2.2.1 TTR_0.23-0 lubridate_1.3.3 tidyr_0.2.0 skm_1.0.2 ggplot2_1.0.1 dplyr_0.4.3
[8] stringr_1.0.0 dkstat_0.08
loaded via a namespace (and not attached):
[1] Rcpp_0.12.1 rstudioapi_0.3.1 magrittr_1.5 MASS_7.3-43 munsell_0.4.2 lattice_0.20-33
[7] colorspace_1.2-6 R6_2.1.1 httr_1.0.0 plyr_1.8.3 xts_0.9-7 tools_3.2.2
[13] parallel_3.2.2 grid_3.2.2 gtable_0.1.2 DBI_0.3.1 lazyeval_0.1.10 assertthat_0.1
[19] digest_0.6.8 reshape2_1.4.1 curl_0.9.3 memoise_0.2.1 labeling_0.3 stringi_0.5-5
[25] scales_0.3.0 jsonlite_0.9.17 zoo_1.7-12 proto_0.3-10
Bestätigt auf meinem Windows 10-Rechner, funktioniert aber gut auf meinem Linux-Rechner. –
Ich denke, das ist ein Windows-Problem. – KERO
Dieses Problem tritt auf, wenn ich die verschiedenen xml-Pakete verwende. Kann jemand erklären, warum enc2utf8 vor dem charToRaw in den xml-Paketen benötigt wird? Sie können nicht im Namen der Autoren sprechen, aber ich möchte nur verstehen, warum es getan ist, und wenn ich vorschlagen kann, dass enc2utf8 entfernt wird, ohne dass es viele neue Probleme verursacht. – KERO