2017-01-29 4 views
0

Nach dem Parsen eines Dokuments mit html.Parse(r io.Reader) erhalten wir einen Knoten Baum. Jeder DOM-Knoten stellt seine Umgebung, den Namen des Tags und die Attribute dieses Tags bereit. See here.Erhalten Sie vollständige Tag/Zeilennummer von net/html

Was ist der beste Weg, um von einem Knotenobjekt zum Zeichenkettentext dieses Knotens in der Datei r zu gelangen, sowie die Zeilennummer dieses Tags innerhalb dieser Datei?

Antwort

0

Das HTML-Paket zeichnet diese Informationen nicht auf, daher ist es nicht verfügbar.

+0

Richtig, ich bin mir dessen bewusst. Was ich frage, ist der beste Weg, um dies zu umgehen. Können wir das HTML-Paket erweitern oder müssen wir es ausbacken und diese Funktionalität hinzufügen? Ist es möglich, unseren eigenen Tokeniser zu schreiben? – wjdp

+0

Es wäre notwendig, es zu verzweigen und die Positionsinformationen sowohl zum Token als auch zum Knoten hinzuzufügen. Kopieren Sie dann überall dort, wo ein Knoten erstellt wurde, die Positionsinformationen aus dem zugehörigen Token, falls vorhanden. – andybalholm

Verwandte Themen