Meine Absicht ist es, den Namen, Ort, Zeitpunkt der Veröffentlichung, Titel der Überprüfung und den gesamten Inhalt der Überprüfung von der Webseite (http://www.mouthshut.com/mobile-operators/Reliance-Jio-reviews-925812061) zu bekommen.Web Scraping mit Selen
Mein Code:
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
firefox_capabilities = DesiredCapabilities.FIREFOX
firefox_capabilities['marionette'] = True
firefox_capabilities['binary'] = '/etc/firefox'
driver = webdriver.Firefox(capabilities=firefox_capabilities)
driver.get('http://www.mouthshut.com/mobile-operators/Reliance-Jio-reviews-925812061')
soup = BeautifulSoup(driver.page_source,"lxml")
for link in soup.select(".profile"):
try:
profile = link.select("p:nth-of-type(1) a")[0]
profile1 = link.select("p:nth-of-type(2)")[0]
except:pass
print(profile.text,profile1.text)
driver = webdriver.Firefox(capabilities=firefox_capabilities)
driver.get('http://www.mouthshut.com/mobile-operators/Reliance-Jio-reviews-925812061')
soup1 = BeautifulSoup(driver.page_source,"lxml")
for link in soup1.select(".col-10.review"):
try:
profile2 = link.select("small:nth-of-type(1)")[0]
profile3 = link.select("span:nth-of-type(3)")[0]
profile4 = link.select("a:nth-of-type(1)")[0]
except:pass
print(profile2.text,profile3.text,profile4.text)
driver = webdriver.Firefox(capabilities=firefox_capabilities)
driver.get('http://www.mouthshut.com/mobile-operators/Reliance-Jio-reviews-925812061')
soup2 = BeautifulSoup(driver.page_source,"lxml")
for link in soup2.select(".more.review"):
try:
containers=page_soup.findAll("div",{"class":"more reviewdata"})
count=len(containers)
for index in range(count):
count1=len(containers[index].p)
for i in range(count1):
profile5 = link.select("p:nth-of-type(i)")[0]
except:pass
print(profile5.text)
driver.quit()
Ich erhalte die Ausgabe für Namen, Ort, Zeit und Titel der Kritik, aber ich bin nicht in der Lage, die vollständige Überprüfung eines Benutzers zu erhalten. Ich wäre dankbar, wenn jemand mir helfen könnte, die Ausgabe für dasselbe zu erhalten, zusammen mit der Optimierung meines Codes (d. H.) Ich möchte, dass mein Code die erforderlichen Daten extrahiert, indem er die Webseite nur einmal lädt. Außerdem wäre es sehr hilfreich für mich, wenn mir jemand helfen könnte, alle Kundenrezensionen von Jio von allen Webseiten der Webseite zu extrahieren.