Ich bin neu mit Python. Kürzlich habe ich ein Projekt, das eine große Menge an Gesundheitsdaten in einer XML-Datei verarbeitet. Hier ist ein Beispiel:speichern große Daten Python
In meinen Daten gibt es etwa 100 von ihnen und jeder von ihnen hat unterschiedliche id, Herkunft, Art und Text. Ich möchte alle Daten in Daten speichern, so dass ich diesen Datensatz trainieren konnte, die erste Idee in meinen Gedanken war, 2D-ARRY zu verwenden (eine ID speichert und die anderen speichern den Text). Allerdings habe ich festgestellt, dass es zu viele Funktionen gibt und ich möchte wissen, welche Funktionen zu jedem Dokument gehören.
Könnte jemand einen besten Weg empfehlen, es zu tun.
Sie können wahrscheinlich mit einem Wörterbuch mit ID als Schlüssel und entweder ein Wörterbuch (mit Features als Schlüssel und ihre Werte als Werte) oder ein Objekt als Wert durchkommen. – DeepSpace
Ich habe das Bild in Ihre Frage kopiert, aber es ist am besten, relevanten Code mit '{}' anstelle von Bild zu posten. – Leb
Soweit Ihr Problem, würde ich vorschlagen, Xml-Parsing-Pakete zu verwenden, um die Daten zu erhalten, wo Sie entweder in Wörterbuch oder möglichen Datenrahmen importieren können. So wie es jetzt steht, ist deine Frage zu weit gefasst. – Leb