Mein Ziel ist es, Anzahl der spezifischen Tags von Links zu bekommen, was ich kratzen möchte. Ich habe die Anzahl der Tags manuell überprüft und mein Code kann nicht alle finden.BeautifulSoup kann nicht alle Tags finden
Ich habe verschiedene Parser wie "html.parser", "html5lib" und "lxml" ausprobiert, aber der Fehler tritt jedes Mal auf.
Mein Code:
from bs4 import BeautifulSoup
from selenium import webdriver
urls = ["http://www.basket.fi/sarjat/ottelu/?game_id=3502579&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502523&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502491&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502451&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502395&season_id=93783&league_id=4#mbt:2-400$t&0=1",
"http://www.basket.fi/sarjat/ottelu/?game_id=3502407&season_id=93783&league_id=4#mbt:2-400$t&0=1"]
for url in urls:
browser = webdriver.PhantomJS()
browser.get(url)
table = BeautifulSoup(browser.page_source, 'lxml')
print(len(table.find_all("tr", {"class":["row1","row2"]})))
Ausgang:
88
87
86
66
86
59
Tor Ausgabe:
88
86
87
87
86
83
Können Sie uns sagen, was genau wollen Sie kratzen? – mostaszewski