Ich bin ratlos auf der Suche nach einer Möglichkeit zum Suchen und Ersetzen von Zeichen basierend auf der Position. Im Grunde, was ich suche es in ein Dokument gehen zu tun undSuchen und Ersetzen in Python - basierend auf unbekannten Zeichen
<gco:DateTime>2016-04-20T11:27:34.8677919-06:00</gco:DateTime>
Mit
<gco:DateTime>2016-04-20T11:27:34</gco:DateTime>
Alles ersetzen, nachdem das Dezimalzeichen muss gelöscht werden. Das Problem ist, dass dies für mehrere Zeitstempel in XML-Dateien gilt und jeder dieser Zeitstempel völlig anders ist. Ich habe ein wenig über Regex gelesen und es scheint eine mögliche Methode zu sein. Jede Hilfe würde sehr geschätzt werden.
bearbeiten Beispiel für XML-Dateiformat:
<?xml version="1.0" encoding="utf-8"?>
<?xml-stylesheet type='text/xsl' href='http://ngis/ngis/metadata/StyleSheet/xslt/nGIS_Metadata.xslt'?>
<gmd:MD_Metadata xmlns:gml="http://www.opengis.net/gml/3.2" xmlns:gmx="http://www.isotc211.org/2005/gmx" xmlns:gts="http://www.isotc211.org/2005/gts" xmlns:gfc="http://www.isotc211.org/2005/gfc" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:gss="http://www.isotc211.org/2005/gss" xmlns:gsr="http://www.isotc211.org/2005/gsr" xmlns:gco="http://www.isotc211.org/2005/gco" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:gmi="http://www.isotc211.org/2005/gmi" xmlns:gmd="http://www.isotc211.org/2005/gmd">
<gmd:fileIdentifier>
<gco:CharacterString>BF244A7CB62491BC74B001BE5DEAA213AAFB9DBA</gco:CharacterString>
</gmd:fileIdentifier>
<gmd:language>
<gco:CharacterString>English</gco:CharacterString>
<gmd:date>
<gco:DateTime>2016-04-20T11:27:34.8677919-06:00</gco:DateTime>
</gmd:date>
@Parfait
Regexes lösen dieses und andere ähnliche Probleme und Sie sollten weiterlesen. In diesem speziellen Fall ist auch das Analysieren und Formatieren von Daten ein guter Ansatz. –
Ich würde Sie außerdem davor warnen, XML viel zu verarbeiten, ohne es tatsächlich in eine richtige Struktur zu zerlegen, indem Sie eine Bibliothek wie 'lxml' oder' ElementTree' verwenden, obwohl Sie vielleicht davonkommen, wenn alle Ihre Transformationen so unkompliziert sind. – holdenweb
Es kann nicht genug betont werden (vielleicht die am höchsten gewählte Antwort auf SO), [regex html/xml files] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-) in sich geschlossene Tags). – Parfait