2009-11-24 12 views
39

Parsing ist etwas, das ich viel in der Entwicklung begriffen habe, aber als ein Junior ist es eines dieser Dinge, von denen ich annehme, dass ich irgendwann den Dreh raushaben werde, wenn es gebraucht wird. In meinem aktuellen Projekt wurde mir gesagt, dass ich einen HTML-Parser für eine bestimmte Funktion finden und verwenden soll. Ich habe ein paar im Web gefunden, aber was macht ein HTML-Parser eigentlich? Und was bedeutet es, ein Objekt zu parsen?Was ist Parsing?

+1

Ich denke [dieser Wikipedia - Artikel] (http: //en.wikipedia.org/wiki/Parsing) ist ein guter Ausgangspunkt. – KB22

Antwort

56

Parsing gilt in der Regel für Text - der Akt des Lesens und Konvertieren von Text in ein nützlicher In-Memory-Format, "Verständnis", was es zu einem gewissen Grad bedeutet. Zum Beispiel wird ein XML-Parser die Folge von Zeichen (oder Bytes) nehmen und sie in Elemente, Attribute usw. umwandeln.

In einigen Fällen (insbesondere Compiler) gibt es eine Trennung zwischen lexical analysis und syntaktische Analyse, so dass die realen " Verstehen "Teil des Parsers arbeitet an einer Sequenz von Tokens (Bezeichner, Operatoren usw.) und nicht an den rohen Zeichen.

+2

+1 Lehrbuchantwort. Du solltest ein Buch schreiben! : p – Mike

+5

Er hat bereits ein Buch geschrieben. C# in der Tiefe – rahul

+0

@Mike - er schon tat – RobV

8

Sie können hier beginnen: http://en.wikipedia.org/wiki/Parsing. Kurzer Auszug:

Parsing oder syntaktische Analyse ist der Prozess eine Reihe von Symbolen der Analyse entweder in natürlicher Sprache oder in Computersprachen, die Regeln einer formalen Grammatik entspricht. Der Begriff Parsing kommt von lateinischen pars (orationis), Bedeutungsteil (von Rede).

+0

Während dieser Link die Frage beantworten kann, ist es besser, die wesentlichen Teile der Antwort hier aufzunehmen und den Link als Referenz zur Verfügung zu stellen. Nur-Link-Antworten können ungültig werden, wenn sich die verknüpfte Seite ändert. – DeanOC

+0

Einverstanden und fertig! – Konamiman

1

Es ist der Prozess der Identifizierung der Token [Tags, Attribute] in einem HTML.

8

Das Parsen nimmt eine Reihe von Daten und extrahiert die aussagekräftigen Informationen daraus. Mit HTML-Analyse suchen Sie etwas HTML zu lesen und eine strukturierte Reihe von Tags und Text zurückgeben

1

In der Informatik und Linguistik, Parsing, oder, genauer gesagt, syntaktische Analyse, ist der Prozess der Analyse eines Textes, gemacht einer Folge von Token (zum Beispiel Wörter), um ihre grammatische Struktur in Bezug auf eine gegebene (mehr oder weniger) formale Grammatik zu bestimmen.

: 0)

Wikipedia

1

Versuchen Sie nicht, selbst etwas anderes als einen trivialen Parser zu schreiben. Es gibt gute Werkzeuge für diese Verwendung ANTLR und bison sind zwei, die ich mir vorstellen kann.

Wenn Sie die Werkzeuge verwenden, können Sie um Hilfe bitten, wenn Sie ein Problem haben.

Prost, Martin.

4

Ein Parser ist eine Compiler/Interpreter-Komponente, die Daten in kleinere Elemente für die einfache Übersetzung in eine andere Sprache bricht. Ein Parser nimmt Eingaben in Form einer Folge von Tokens oder Programmanweisungen und baut üblicherweise eine Datenstruktur in Form eines Syntaxbaums oder eines abstrakten Syntaxbaums auf.