Ich bin neu mit XML-Datenbank.Analysieren von XML zu DATENRAHMEN
Ich würde versuchen, mein Problem zu erklären.
Es gibt eine Datenbank in einer XML-Datei von einer mexikanischen Regierungsseite, die ich herunterladen möchte, um sie für meine Analyse zu verwenden.
Die Seite, wo Sie die Daten finden können, ist dies.
Der direkte Download-Link ist das, glaube ich, wie ein externes Repository ist. Mit freundlichen Grüßen weiß ich nicht.
https://publicacionexterna.azurewebsites.net/publicaciones/prices
Wenn Sie auf den Link klicken, wird die Datenbank im XML-Format automatisch heruntergeladen.
Die Datenbank ist über mexikanische Gaspreise von Einzelhandelsverkäufern mit seinem Standort in Dezimalgraden über das Land.
Ich kann die Datenbank herunterladen und in eine Windows .xls-Datei und dann ein .csv-Archiv einfügen und dann zu meiner R-Umgebung für die Analyse.
Das allgemeine Problem ist, wenn ich versuche, direkt von der Seite in meine R-Umgebung zu downloaden Ich bin nicht in der Lage, ein strukturiertes Datenbankformat zu erhalten, das mir erlaubt, die Analyse durchzuführen.
Ich erhalte doppelte Zeilen und kann nicht alle Attribute für jede Ebene der Daten extrahieren.
Dies ist das Skript, das ich selbst schreiben konnte und im Internet nach Hilfe suchte.
# CRE FILES
library(easypackages)
my_packages <- c("rlist","readr", "tidyverse", "lubridate", "stringr",
"rebus", "stringi", "purrr", "geosphere", "XML", "RCurl", "plyr")
libraries(my_packages)
# Link de descarga de documentos
link1 <-(https://publicacionexterna.azurewebsites.net/publicaciones/prices")
# First we load the xml file to the enviroment
data_prices <- getURL(link1)
xmlfile <- xmlParse(data_prices)
class(xmlfile)
xmltop <- xmlRoot(xmlfile)
base <- ldply(xmlToList(xmltop),data.frame)
Das Problem ist, dass ich das Datum als eine andere Spalte möchte, nicht als Folge. Danke für deine Antworten.
Sie wahrscheinlich mehr Hilfe bekommen würden, wenn Sie mit der Arbeit geschrieben, minimal R Code – hrbrmstr
Oh sorry, ich dachte, dass mit dem Code, den ich genug gesetzt war, ich weiß nicht, wie zu erklären, aber ich würde versuchen. –