Ich mag einige kodi Addon, die re.compile Daten Schrott in BeautifulSoup4
ist der ursprüngliche Code wie diesexbmc/kodi Python Schrott Daten mit BeautifulSoup
import urllib, urllib2, re, sys, xbmcplugin, xbmcgui
link = read_url(url)
match = re.compile('<a class="frame[^"]*"'
' href="(http://somelink.com/section/[^"]+)" '
'title="([^"]+)">.*?<img src="([^"]+)".+?Length:([^<]+)',
re.DOTALL).findall(link)
for url, name, thumbnail, length in match:
addDownLink(name + length, url, 2, thumbnail)
und der HTML-Code verwenden, bearbeiten
<div id="content">
<span class="someclass">
<span class="sec">
<a class="frame" href="http://somlink.com/section/name-here" title="name here">
<img src="http://www.somlink.com/thumb/imgsection/thumbnail.jpg" >
</a>
</span>
<h3 class="title">
<a href="http://somlink.com/section/name-here">name here</a>
</h3>
<span class="details"><span class="length">Length: 99:99</span>
</span>
.
.
.
.
.
.
.
.
.
.
.
</div>
jetzt, wie alle bekommen url
(href) und name
und lenghth
und thumbnail
BeautifulSoup4
mit und fügen sie sie in addDownLink(name + length, url, 2, thumbnail)
Was versuchen Sie eigentlich zu bekommen und warum benutzen Sie so eine komplizierte Regex? –
@PadraicCunningham ist nicht ich, die diese komplizierte Regex im versuchen, es in BeautifulSoup4 zu konvertieren, um es einfach zu machen können Sie mir helfen ?? –
Gibt es einen Klassennamen, den wir verwenden können? Oder was ist die tatsächliche Anforderung zu erfüllen? –