Ich versuche, die URLs der Bewertungen auf dieser Webseite http://uk.ign.com/games/reviews dann öffnen die Top 5 in separaten TabsWie kann ich extrahieren URL-Links von IGN Website
Gerade jetzt zu extrahieren, ich habe verschiedene Auswahlen versucht zu versuchen, nimm die richtigen Daten auf, aber nichts scheint etwas zurückzugeben. Ich kann nicht scheinen, die URLs jeder Rezension in der Liste zu extrahieren, geschweige denn die ersten 5 in separaten Tabs zu öffnen.
Ich verwende Python 3 mit Python IDE
Hier ist mein Code:
import webbrowser, bs4, requests, re
webPage = requests.get("http://uk.ign.com/games/reviews", headers={'User-
Agent': 'Mozilla/5.0'})
webPage.raise_for_status()
webPage = bs4.BeautifulSoup(webPage.text, "html.parser")
#Me trying different selections to try extract the right part of the page
webLinks = webPage.select(".item-title")
webLinks2 = webPage.select("h3")
webLinks3 = webPage.select("div item-title")
print(type(webLinks))
print(type(webLinks2))
print(type(webLinks3))
#I think this is where I've gone wrong. These all returning empty lists.
#What am I doing wrong?
lenLinks = min(5, len(webLinks))
for i in range(lenLinks):
webbrowser.open('http://uk.ign.com/' + webLinks[i].get('href'))
Glück gehabt, diese Links zu finden? – Nevermore
Ich kann alle Links auf der Webseite finden, aber ich kann die Links nicht finden, die ich will. webLinks = webPage.find_all ('a') gibt mir alle Links auf der Seite Jetzt versuche ich die Links unter "Artikel-Titel" mit "h3" Klasse zu extrahieren. Ich habe versucht, WebItems = webPage.find_all ('a', { 'Klasse': "title"}) webby = webPage.find_all (Klasse _ = "h3") Keines dieser Arbeit, vielleicht sollte ich eine for-Schleife irgendeiner Art? – SeyiA