2010-11-18 8 views

Antwort

5

In Bezug auf

Gibt es eine generic/automatische Weise in R XML-Dateien mit den Knoten und Attributen, erzeugen zum Speichern dass Informationen und dann bevölkern diese Tabellen MySQL-Tabellen automatisch zu analysieren.

die Antwort ist eine gute alte Ja, Sie können, zumindest in R.

Das XML Paket für R kann XML-Dokumente lesen und zurück R data.frame Typen in einem einzigen Aufruf die xmlToDataFrame() Funktion.

Und das RMySQL Paket data.frame Objekte in die Datenbank in einem einzigen Befehl übertragen --- einschließlich Tabellenerstellung wenn nötig --- mit der dbWriteTable() Funktion definierte im gemeinsamen DBI Backend für R und für MySQL zur Verfügung gestellt von RMySQL.

Also kurz gesagt: zwei Zeilen können es tun, so können Sie sich leicht eine neue Hilfsfunktion schreiben, die es zusammen mit einer entsprechenden Menge an Fehlerprüfung tut.

4

Sie sind drei separate Operationen: Parsing, Tabellenerstellung und Datenauffüllung. Sie können alle drei mit Python machen, aber es gibt nichts "automatisches" darüber. Ich denke nicht, dass es so einfach ist.

Zum Beispiel ist XML hierarchisch und SQL ist relational, set-basiert. Ich glaube nicht, dass es immer so einfach ist, ein gutes relationales Schema für jeden einzelnen XML-Stream zu erhalten, auf den Sie stoßen können.

0

Wir machen so etwas bei der Arbeit manchmal, aber nicht in Python. In diesem Fall muss für jede Verwendung ein benutzerdefiniertes Programm geschrieben werden. Wir haben nur einen SAX-Parser verfügbar. Die Verwendung eines XML-Decoders, um ein Wörterbuch/Hash in einem einzigen Schritt zu erhalten, würde viel helfen.

Am allerwenigsten Sie es zu sagen haben würde, welche Karte Tags zu Tabellen und Felder, die keine vorbestehende lib das wissen können ...

1

das XML-Paket Es gibt XML-Daten in R für das Lesen, und das RMySQL-Paket zum Schreiben von Daten von R in MySQL.

Zwischen den beiden gibt es eine Menge Arbeit. XML übertrifft den Umfang eines RDBMS wie MySQL, sodass etwas, das mit jedem XML-Code umgehen könnte, entweder lächerlich komplex oder trivial unbrauchbar wäre.

Verwandte Themen