Ich versuche, alle aufgezeichneten Ereignis Tabelle von der Website http://southasiaterrorism.trfetzer.com/districts/17497-IND-Nandurbar.html zu kratzen. Ich benutze Scrapy Spider dafür, aber es ist nicht möglich, diese Tabelle zu bekommen, da sie dynamisch geladen wird. Ich habe versucht, Selen zu verwenden, aber kein Ergebnis, ich habe die gleiche statische HTML-Seite ohne die Tabelle geladen. Jede Hilfe würde sehr geschätzt werden.Verwenden von Selen mit Scrapy
0
A
Antwort
0
Wie von @Stack erwähnt, ist der Inhalt nicht dynamisch geladen, es ist in der Seite innerhalb der <script>
Tags. Sie können so etwas wie dies versuchen:
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
for tr in soup.find_all('tr')[2:]:
tds = tr.find_all('td')
print (tds)
Von this question.
Hinweis: Dieser Code wurde nicht getestet.
+1
danke, in der Tat war die Lösung in BeautifulSoup, aber ich verwende auch regexp, um die benötigten Daten zu holen. –
+0
Ich empfehle Python-Anfragen anstelle von Urllib2 zu verwenden – PHA
Verwandte Themen
- 1. Scrapy & Selen
- 2. Selector Scrapy Selen nicht
- 3. scrapy arbeitet nicht mit Selen
- 4. Verwenden von XPath mit Scrapy
- 5. Scraping einer Website mit Scrapy und Selen
- 6. Scrapy mit Selen, Webdriver nicht instanziieren
- 7. Selenium + Scrapy verwenden
- 8. Selen innerhalb von Scrapy funktioniert nicht
- 9. Scrapy mit Selen Crawlen, aber nicht kratzen
- 10. Scrapy - dynamische warten auf Seite zu laden - Selen + Scrapy
- 11. Verwenden von Scrapy Shell mit FormRequest
- 12. Einloggen mit Formular geladen mit Ajax (scrapy): selen vs scrapy-splash
- 13. scrapy Selen Login dann Seiten suchen
- 14. Klicken Sie auf Java Element Scrapy + Selen
- 15. Scrapy Selen Klicken Sie auf Javascript Verbindung
- 16. Kann nicht Screenshot mit Selen nehmen, wenn ich execute_script() Funktion verwenden - Selen
- 17. Scrapy: Warum Pipelines verwenden?
- 18. Crawl Daten Scrapy + Selen + PhantopJS unter Verwendung von Daten verloren
- 19. Python mit Scrapy und Selen erhalten JavaScript erzeugen Inhalt
- 20. Verwenden von Scrapy zum Einkaufen einkaufen Daten
- 21. scrapy xpath wie zu verwenden?
- 22. Verwenden von Scrapy Shell mit Splash Rückgabe leerer Wert
- 23. Scrapy Authentifizierung Login mit Cookies
- 24. Scrapy oder Selen oder Mechanize, um Web-Daten zu kratzen?
- 25. den dynamischen Inhalt mit Python scrapy
- 26. Verwenden scrapy + splash return html
- 27. Scrapy & Selen: Wie XPATH zu schleifen und einen Klick Preform
- 28. Selenium nach authentifizierter Login-Sitzung mit Scrapy
- 29. Kann nightwatch.js usingServer von selen-webdriver verwenden?
- 30. Python/Scrapy/- Scrapping von Arstechnica
Nein, es wird nicht dynamisch geladen, überprüfen Sie einfach die Seitenquelle in 'script' Tag gibt es eine Liste aller dieser Tabellenelemente, nur extrahieren Sie das. Keine Notwendigkeit von Selen für diese – Stack
, aber ich sehe nicht, warum ich negative Zeichen verdienen, vielleicht für jemanden, es ist einfach, aber ich bin Neuling in all diesen Dingen. –
Es ist egal, nur weiter zu lernen:) @ Sirak Ghazaryan – Stack