2008-10-22 5 views
8

Ich versuche, die Daten von Einträgen in zwei verschiedenen RSS-Feeds durch feedparser zu bekommen.Parsing verschiedener Datumsformate von Feedparser in Python?

Hier ist, was ich tue:

import feedparser as fp 
reddit = fp.parse("http://www.reddit.com/.rss") 
cc = fp.parse("http://contentconsumer.com/feed") 
print reddit.entries[0].date 
print cc.entries[0].date 

Und hier ist, wie sie kommen:

2008-10-21T22:23:28.033841+00:00 

Wed, 15 Oct 2008 10:06:10 +0000 

ich an den Punkt zu bekommen, wo ich herausfinden kann, was leicht neuer ist.

Ich habe versucht, mit dem Datetime-Modul von Python und Durchsuchen der Feedparser-Dokumentation, aber ich komme nicht über dieses Problem hinaus. Jede Hilfe würde sehr geschätzt werden.

Antwort

14

Parsing von Daten ist ein Schmerz mit RSS-Feeds in der Wildnis, und das ist, wo feedparser kann eine große Hilfe sein.

Wenn Sie die *_parsed Eigenschaften (wie updated_parsed) verwenden, hat feedparser die Arbeit getan und wird ein 9-Tupel-Python-Datum in UTC zurückgeben.

Weitere Details finden Sie unter http://packages.python.org/feedparser/date-parsing.html.