2009-07-21 3 views
0

Was ist der beste Weg, Skripte für einen Browser zu erstellen?Wie HTML in einem clientseitigen Skript analysieren?

Ich brauche ein paar HTML-Seiten auf verschiedenen Domains

ich auf windows bin zu analysieren und firefox vor allem nutzen.

+2

Das ist wirklich unspezifisch ist. –

+0

Bitte wählen Sie eine Sprache und ein Betriebssystem. Sie können Browser nicht einfach skripten, aber Sie können Programme schreiben, um Webseiten zu holen und zu parsen, genau wie ein Browser. –

Antwort

0

Wenn es nur darum geht, die Seiten aufzurufen, um damit alles zu tun, was Sie wollen, wird das eingebaute Modul urllib in Python das für Sie tun.

0

Es klingt wie Sie Webseiten abrufen und analysieren möchten, um aussagekräftige Daten zu extrahieren? Ich würde etwas wie TagSoup (für Java) vorschlagen, das nette SAX-Ereignisse abfeuert, die Sie direkt verwenden können, oder ein XML-Modul Ihrer Wahl verwenden (roher DOM, JDOM, dom4j, XOM, etc ...). Die TagSoup-Seite listet auch eine Reihe von Referenzen für andere Sprachen auf, saugen Sie als Schöne Suppe für Python, Rubyful Soup für Ruby und andere.

Von dort würde ich vorschlagen, etwas wie XPath verwenden, um die Bits der Daten abzurufen, die Sie möchten. Eine andere Option wäre XSLT, um den HTML-Code in ein einheitliches Format umzuwandeln, das Sie leichter manipulieren können.

Verwandte Themen