Ich habe versucht, www.zomato.com für mehr als eine Woche zu kratzen und jetzt habe ich meine Probleme über das Netz gesucht, aber ich konnte nicht die richtige Lösung dafür gefunden. also habe ich hier meine Frage gestellt.
Wie kratze ich https Website Daten mit Python und Selen webdriver
Hier ist mein Code für den webscraper.
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import Select
from selenium.webdriver.support.ui import WebDriverWait
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import NoAlertPresentException
import sys
import lxml
import unittest, time, re
class Sel(unittest.TestCase):
def setUp(self):
self.driver = webdriver.PhantomJS(executable_path='\phantomjs.exe')#phantom js
self.driver.implicitly_wait(30)
self.base_url = "https://www.zomato.com"
self.verificationErrors = []
self.accept_next_alert = True
def test_sel(self):
driver = self.driver
delay = 3
driver.get(self.base_url + "hyderabad")
driver.find_element_by_link_text("All").click()
for i in range(1,100):
self.driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(4)
html_source = driver.page_source
data = html_source.encode('utf-8')
if __name__ == "__main__":
Wenn ich in Python ausführen 3.4 heißt Verzeichnis/py -3,4 selenium.py Ich erhalte diesen Fehler
selenium-python-phantomJS-SSL.
Kann mir jemand zu diesem Thema helfen?
Mit freundlichen Grüßen.
den Text von Fehlermeldungen einfügen, stellen keine Verbindung zu Screenshots. –