2015-04-18 16 views
5

Dieser Code, hrefs zum Inhalt zurückgegeben, jetzt möchte ich Inhalte aus diesem hrefs extrahieren und an meine Ansicht gesendet. Name divs, die ich extrahieren müssen:Wie extrahiert man Daten mit Goutte Crawler?

<div class="c_pad"> 
    <div class="c_label"> 
    <span class="std_header2">Contact:</span> 
    </div> 
<div class="c_name"> 
    <span class="std_text_b">Monkey</span> 
</div> 
<div class="clear"></div> 
</div> 

<div class="c_pad"> 
    <div class="c_label"> 
     <span class="std_header2">Phone number:</span> 
    </div> 
    <div class="c_phone"> 
     <span class="std_text_b">001111111</span> 
    </div> 
    <div class="clear"></div> 
</div> 

for($i=0; $i <= 1; $i++) 
    { 
     $p = new Client(); 
     $d = $p->request('GET', ''.$link.'&std=1&results='. $i); 
     $n = $d->filter('a[class="o_title"]')->each(function ($node) 
     { 
     $pp = new Client(); 
     $dd = $pp->request('GET', $node->attr('href')); 
     $kk = $dd->filter('div[id="adv_desc"]')->each(function ($tekst) { echo $node->attr('href').'<br>'.$tekst->text(); 
        }); 
     }); 
    } 

Antwort

3

Sie wollen bestimmte Tags mit Attributen filtern.

Aber Sie verwenden $d->filter('a[class="o_title"]'). Dies filtert das Tag a mit dem Attribut class="o_title". Und das ist nicht Teil Ihres Inhalts.

Sie müssen nur Ihren Knotenfilter anpassen, um die richtigen Elemente auszuwählen.

Verwenden Sie die jQuery-Selektoren Syntax: https://api.jquery.com/category/selectors/

Referenzierung in der Dokumentation von Symfony des DomCrawler, der von Goutte verwendet wird: http://symfony.com/doc/current/components/dom_crawler.html#node-filtering

+0

bearbeitet ersten Beitrag .. aber jetzt: 'Nicht definierte Variable: node' – user3458952

+0

Sie sind Arbeiten an etwas, wo niemand Ihnen helfen kann, weil wir das Problem nicht reproduzieren können. Zum Beispiel: Wo ist in Ihrem Beispiel ein 'div' mit' id = adv_desc'? Warum 'each (function ($ tekst)'? Gib die Variable $ node aus, um den Inhalt zu überprüfen. Var_dump() ist dein Freund. –

Verwandte Themen