2017-05-10 6 views
1

I feedparser in einem Skript bin mit, die für die RSS-URLs im Allgemeinen arbeiten wird, aber es gibt eine URL, die mir Kopfschmerzen ist zu geben: tabbforum.com/feed.atomfeedparser SAXParseException, Bozo: 1

Ich bekomme eine SAXParseException('not well-formed (invalid token)',).

import feedparser 

def read_from_feed(self, rss_url): 
    feed = feedparser.parse(rss_url) 
    for entry in feed.entries: 
     print('do stuff') 


>>>>feed 
{'feed': {}, 'entries': [], 'bozo': 1, 'encoding': 'utf-8', 'version': '', 'bozo_exception': SAXParseException('not well-formed (invalid token)',), 'namespaces': {}} 

Ich denke, dass etwas mit der XML (?) Falsch ist. Hat jemand vorhergehende Erfahrungen gemacht und konnte einen Workaround finden? Oder haben Sie eine Idee, was das Problem ist?

Antwort

1

Hatte ein ähnliches Problem. In meinem Fall habe ich vergessen, http:// vor URL zu setzen und feedparser behandelte es nicht als URL, sondern als RSS-XML.

+1

Es funktioniert! Ich war mir so sicher, dass ich das probiert habe, aber anscheinend nicht. Vielen Dank! – malla

Verwandte Themen