def crawl(url):
html = getHTML(url) # getHTML() retruns HTTPResponse
print(html.read()) # PRINT STATMENT 1
if (html == None):
print("Error getting HTML")
else:
# parse html
bsObj = BeautifulSoup(html, "lxml")
# print data
try:
print(bsObj.h1.get_text())
except AttributeError as e:
print(e)
print(html.read()) # PRINT STAETMENT 2
Was ich nicht verstehe ist ..Printing gleichen Httpresponse-Objekt gibt verschiedene Ausgänge - Python
PRINT STATEMENT 1 druckt das ganze html während PRINT STATEMENT 2 druckt nur b''
Was passiert hier? ..Ich bin ziemlich neu in Python.
Als Nebenbemerkung sollten Sie 'html == None' nicht tun. Siehe http://stackoverflow.com/questions/14247373/python-none-comparison-should-i-use-is-or. – edwinksl
@edwinksl ty .. das ist hilfreich – reversiblean