2009-07-18 9 views
2

In meinem C# -Projekt wurde ich mit der Analyse einer SGML - Datei befasst und habe sehr naiv versucht, XmlReader zu verwenden, was zu einigen interessanten Enthüllungen geführt hat SGML und wohlgeformtes XML, etc.)SGML - Parser .NET - Empfehlungen

So denke ich, dass ich nur einen guten SGML-Parser brauche, der es in eine XML-Datei konvertiert und von dort geht. Bei meiner Suche habe ich zwei SGML-Parser gefunden, die mit meinem C# Projekt integrieren:

Weitere Empfehlungen?

+0

Ich bin neugierig. Ich wusste nicht, dass Amy SGML immer noch benutzt. Wozu? –

+0

Avid INEWS http://www.avid.com/solutions/808.htm verwendet ein SGML-basiertes Markup namens News Story Markup Language (NSML) zum Speichern und Ausdrücken von Story-Informationen. Ich kann aus Sicht von Avid sehen, warum sie SGML verwendet haben, aber das ist eine andere Geschichte (kein Wortspiel beabsichtigt). –

+1

Das EDGAR-System der SEC verwendet SGML, um die Berichterstattung an die SEC zu verbessern. –

Antwort

4

Offenbar SgmlReader der hier aktualisiert:

http://developer.mindtouch.com/Community/SgmlReader

+0

Nicht verwerfen: MindTouch reorganisierte sich selbst, aber wenn Sie dem Link folgen, suchen Sie nach 'SgmlReader' und jagen Sie, bis Sie den Download für die gesamte MindTouch-Suite gefunden haben, der den SgmlReader enthält. Wütend! –

1

HTML ist eine Implementierung von SGML. Wenn Sie HTML korrekt parsen wollen, benötigen Sie einen SGML-Parser. SGMLreader scheint diesen Anforderungen gut zu entsprechen, und ich plane, es selbst zu verwenden. Ich würde vorschlagen, HTML sauber zu verwenden. Es ist eine native Anwendung, aber für sie gibt es .net Bindings. Wenn Sie vollständig verwalteten Code benötigen, ist der SGMLreader der richtige Weg.

+0

Einverstanden. Ich habe seitdem SgmlReader benutzt und es hat ziemlich gut funktioniert. –