2012-04-02 9 views
0

Ich habe die neueste Version von phpcrawler heruntergeladen, und ich kann auf eine Testwebsite zugreifen.PHPcrawler - tmp Datei

I und einen Text auf dieser Seite nur ein Bild haben, betreibe ich den Crawler und ich den Text minus das Bild erhalten, weil ich das richtige tat $crawler->addNonFollowMatch("/.(jpg|gif|png)$/ i");

kann ich es nicht die tmp Datei zu speichern speichert nicht die einzigartige tmp Datei in dem Ordner, den ich den Crawler ausführen, habe ich versucht, eine benannte Datei nicht Glück zu speichern.

Ich habe viele abgeschriebene Fehler in verschiedenen Zeilen in allen PHP-Dateien gefunden, zum Beispiel: @fopen, die @ verursachen Probleme in verschiedenen Bereichen. Ich benutze PHP und kann auch Regex tun. David.

Antwort

0

Ich beantwortete meine eigene Frage, seit ich sehe, dass PHPCrawler Fragen wirklich nicht beantwortet werden; Ich habe eine Frage aus dem letzten Jahr nicht beantwortet. Ich werde es auch beantworten, obwohl es zu spät sein könnte, etwas Gutes zu tun. Das ist die Antwort.

Ich habe in einem modifizierten phpcrawler ich für meine Bedürfnisse angepasst:

$fp = fopen('c:/test/poopoo.txt','w'); 
fwrite($fp,($page_data['source'])); 
fclose($fp); 

Sie es setzen, bevor die Datei Spülung und die Instanz der Klasse erstellen.

Ich fand heraus PHP Simple HTML DOM Parser von this project funktioniert gut. Wenn Sie mehr Kontrolle brauchen, verwenden Sie RegExp, aber das hat eine steile Lernkurve.

+0

Herzlichen Glückwunsch zum Update und danke, dass Sie sich für die Untergemeinschaft PHPCrawler entschieden haben! Wenn Sie in der Lage sind, achten Sie bitte darauf, Ihre Antwort als "akzeptiert" zu markieren, damit andere von Ihrem Erfolg lernen können. Prost ~ –

Verwandte Themen