0
begann gerade heute Nachmittag Python zu lernen. Der Versuch, den RSS-Feed von kubuntu.org (einfacher html) als Praxis zu kratzen, aber ich kann nicht herausfinden, wie der HTML zu navigieren und nur die FEEDTITLE drucken:Wie navigiere ich HTML mit bs4?
#!/usr/bin/python3.5
import bs4 as bs
import urllib.request
site = urllib.request.urlopen('https://kubuntu.org/feed').read()
soup = bs.BeautifulSoup(site, 'lxml')
for title in soup.find_all('item'):
print(title.text)
EDIT:
Zugabe title
zu Die find_all
Zeile gibt mir, was ich will, aber es gibt immer noch eine Menge Daten, die auch das Title-Tag verwendet.
#!/usr/bin/python3.5
import bs4 as bs
import urllib.request
site = urllib.request.urlopen('https://kubuntu.org/feed').read()
soup = bs.BeautifulSoup(site, 'lxml')
for title in soup.find_all(['item', 'title']):
print(title.text)