2017-05-08 5 views
-4

Ich versuche viele Methoden, um diese Daten zu lösen, aber es kann nicht funktionieren. strip() und replace() Methoden sehen wie auf dem Bild aus, es funktioniert nicht. Bitte hilf mir.Ich versuche, das Datum knapp zu sein, aber es funktioniert nicht

` improt requests 
    from lxml import html,etree 
    from selenium import webdriver 
    import time 


    file_name = 'dubanxinlixue.json' 

    driver = webdriver.Chrome() 
    url_string = [] 
    name_data, price_data = [], [] 
    jd_goods_data = {} 
    page = 0 
    while True: 

     url = 'https://book.douban.com/tag/%E5%BF%83%E7%90%86%E5%AD%A6?start={page}&type=S'.format(page=page) 
     url_string.append(url) 
     page += 20 
     if page > 980: 
      break 

    for i in url_string: 
     driver.get(i) 
     base_html = driver.page_source 
     selctor = etree.HTML(base_html) 
     j = 1 
     for j in range(20): 
      j += 1 

      name = '//*[@id="subject_list"]/ul/li[%d]/div[2]/h2/a[1]/@title'%(j) 
      get_name =selctor.xpath(name)[0] 
      describe = '//*[@id="subject_list"]/ul/li[%d]/div[2]/div[1]/text()'%(j) 
     get_describe = selctor.xpath(describe)[0] 

     get_describe.string.strip() 
     print(get_describe)` 

the get_describe looks like this ,[the result of get_describe][1] 
+2

Es ist völlig unklar, was Sie erreichen wollen. Beschreiben Sie die gewünschte Ausgabe, beschreiben Sie, wie es jetzt in Ihrer Frage funktioniert. – gonczor

+1

Können Sie die Frage klären? – Metareven

+0

danke für Gonczor und Metareven Hilfe, aber ich finde den Fehler, sehr danke Hilfe –

Antwort

0
new_get_describe = get_describe.strip() 
print(new_get_describe) 
Verwandte Themen