Ich benutze Beautifulsoup mit Python. Ich versuche, Elemente von einem Link mit einem Hash # zu bekommen. Es ist ein Seitenumbruch Link, der Teil nach dem # ist die Seitenzahl.Beautifulsoup und Link mit einem Hash #
Es funktioniert nicht, ich verstehe das Problem, weil urllib2 kann nicht damit umgehen, da der Teil der URL nach der # ist für die clientseitige Handhabung und wird nie an den Server gesendet.
So überprüfte ich die reale URL der Registerkarte Netzwerk der Entwickler-Tools in Chrome und es gibt mir dies:
Es sieht aus wie der Server nicht diese URL überhaupt, weil es nicht mag gibt mir eine leere Seite zurück, die nur dieses seltsame Ergebnis enthält: {"filtersBlock":"\n\n
Also meine Frage ist, gibt es eine Möglichkeit, diese Art von Verbindung mit BeautifulSoup zu behandeln?
Ich habe einen Weg gefunden, dies mit BeautifulSoup zu tun, um das DOM und Selen zu crawlen, um diese Links zu handhaben, die ein # enthalten. Übergeben Sie einfach den Link, der den # zu Selenium-Treiber mit 'driver.get (" www.myserver.com/products#/page-2 ") enthält. – Laurent