Ich bin ein Neuling im Web Scraping. Ich tun, wie untenWie URL aus einem HTML extrahieren
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
html = urlopen("http://chgk.tvigra.ru/letopis/?2016/2016_spr#27mar")
soup = BeautifulSoup(html, "html.parser")
res = soup.find_all('a', {'href': re.compile("r'\b?20\b'")})
print (res)
und
[]
Mein Ziel bekommen, ist dieses Fragment
<script language="javascript" type="text/javascript">
cont = new Array();
count = new Array();
for (i=1979; i <=2015; i++){count[i]=0};
cont[1979] = "<li><a href='?1979_1#24jan'>24 января</a>" +
..............
cont[2016] = "<li><a href='?2016/2016_spr#cur'>Весенняя серия</a>" +
"<li><a href='?2016/2016_sum#cur'>Летняя серия</a>" +
"<li><a href='?2016/2016_aut#cur'>Осенняя серия</a>" +
"<li><a href='?2016/2016_win#cur'>Зимняя серия</a>";
Und ich versuche, das Ergebnis wie folgt zu erhalten
'?2016/2016_spr#cur'
'?2016/2016_sum#cur'
'?2016/2016_aut#cur'
'?2016/2016_win#cur'
Von 2000 zu diesem Moment (so '20' in "r'\b?20\b'"
ist aus diesem Grund). Kannst du mir bitte helfen?
Ich mochte das, aber ich bekam reichlich für '2000' nur '2000', nicht?' 2000_exp # 10sep' wie ich will – Edward