Im Allgemeinen versuche ich, mindestens einige Tags von dieser Site zu bekommen, und gibt immer keine. Ich habe keine Ahnung, wie ich das beheben kann.Python-Parser-Ausgaben Keine
Es gibt eine Schaltfläche Tickets, nachdem Sie es von der Seite drücken gibt es ein zusätzliches Panel, also möchte ich es analysieren, ich kann nicht verstehen, wie. Wie ich es verstehe, wird diese Registerkarte nicht sofort nach dem Klicken geladen, was ich als nächstes nicht verstehe. P.S. habe gerade angefangen es zu lernen.
# coding: utf-8-sig
import urllib.request
from bs4 import BeautifulSoup
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.106 Safari/537.36"}
def get_html(url):
request = urllib.request.Request(url,None,headers)
response = urllib.request.urlopen(request)
return response.read()
def parse(html):
soup = BeautifulSoup(html,"html.parser")
table = soup.find('body', class_='panel-open')
print(table)
def main():
parse(get_html('http://toto-info.co/'))
if __name__ == '__main__':
main()
Seiten wie diese können manchmal mit Hilfe von Selen (* siehe * http://selenium-python.readthedocs.io/) gekratzt werden. Eine Sache, die Sie mit Selenium machen können, ist die 'execute_script' Methode von' webdriver' um Javascript Code auszuführen. Zum Beispiel können Sie 'document.documentElement.outerHTML' ausführen. Ich verstehe, dass die HTML5-API es ermöglicht, in lokalen Speicher zu schreiben; Ich muss jedoch noch Details ausarbeiten. –