2016-12-19 15 views
2

ich eine grundlegende Web-Crawler-Arbeit für diese Webseite tue (nur für Studien Zweck, und ich habe ihre Erlaubnis bekam):Web-Crawler: Web-Content wird nicht im HTML-Code auf

http://www.seattle.gov/council/calendar#/?i=0

Was ich tun wollte, ist, alle Ereignisse "Zeit", "Beschreibung" und "Ort" in diesem Formular zu bekommen. Ich habe versucht, Python regulären Ausdruck, aber es sieht aus wie diese Informationen nicht im HTML-Code dieser Seite angezeigt wird. Stattdessen benutze ich ein Selenium, aber ich weiß immer noch nicht, wo ich diese Informationen finden kann.

+0

Sie bieten ** RSS-Feed **. Siehe: http://www.trumba.com/calendars/seattle-city-council.rss –

Antwort

1

Manchmal sind die Dinge vor dir, aber du siehst sie nicht.

Sie können diese Daten von ihrem RSS Feed abrufen/extrahieren. Es ist hier: http://www.trumba.com/calendars/seattle-city-council.rss

Hoffe das hilft.

+0

Ich habe nie über diese Option nachgedacht! Ich danke dir sehr! Es kostete mich den ganzen Nachmittag ... – Emile

+0

Mein Vergnügen @Emile –

Verwandte Themen