http://www.wfri.re.kr/client/PublishHp.do?command=view&list_dis_txt=PUB¤t_page=1&isu_year=all&list_unq_no=RP00000001847&search_category=&search_keyword=&pub_dt=20170203&topMenuNo=H20000&leftMenuNo=H20100
Ich krabbele diese Seite.Ich kann Tag in HTML nicht finden
Ich bin mit Python3 und BeautifulSoup
Mein Crawler keine Tags finden Sie hier.
Ich möchte die PDF-Datei hier herunterladen.
Beautifulsoup kann keine Markierung von dieser Seite abkratzen.
Warum?
def second_crawler(second_url):
second_url = 'http://www.wfri.re.kr/client/PublishHp.do?command=view&list_dis_txt=PUB¤t_page=1&isu_year=all&list_unq_no=RP00000001847&search_category=&search_keyword=&pub_dt=20170203&topMenuNo=H20000&leftMenuNo=H20100'
source_code = requests.get(second_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text, 'lxml')
print(soup) # for debug
# tdTag = soup.findAll('td',class_='view_cont')
# print(len(tdTag)) ## result is 0. Why??
Können Sie uns den Code zeigen, den Sie verwendet haben? Einfacher zu helfen, wenn wir wissen, in welche Probleme Sie speziell laufen ... – serk
@serk OK, es ist sehr einfach. Überprüfe meinen Code. – StackQ
@ Sollte ich Selen verwenden? – StackQ