2009-04-30 15 views
0

Ich bin für das Sammeln von Informationen über einige Sexualstraftäter eine Locke Drehbuch zu schreiben, habe ich das Skript entwickelt, die unten stehenden Links, wie gegeben Abholung ist:Wie extrahiere ich Daten von einer Webseite mit Regexes?

http://criminaljustice.state.ny.us/cgi/internet/nsor/... (snipped URL)

Wenn wir nun auf diesen Link gehen Ich möchte Informationen unter allen Feldern auf dieser Seite wie Offender Id:, Nachname usw. in meine eigenen Variablen eintragen. Ich bin sehr schwach in Regex, deshalb bin ich hier. Oder gibt es einen anderen Weg?

Kann mir jemand dabei helfen?

Antwort

4

phpQuery ist sehr schön für Screen-Scraping in PHP. Damit können Sie das DOM zugreifen, mit der gleiche Methoden jQuery hat

+0

können Sie mir mehr über PHP-Abfrage sagen, wie es funktioniert? –

0

ich neige dazu, mit dem vorherigen Plakate über RegEx zustimmen nicht das richtige Werkzeug für den Job zu sein, wenn Sie nur einen schnellen und schmutzigen Ausdruck mögen, hier geht:..

Offender Id:.* 
.* [0-9]* 

HINWEIS: Sie müssen den Zeilenumbruch in diesen Ausdruck einfügen. Beachten Sie auch, dass dies sehr zerbrechlich ist, da es zerbrechen wird, wenn sich die Quelle, die Sie analysieren, sehr ändert.

Verwandte Themen