2010-12-22 7 views
0

Ich büste meinen Kopf, aber kann dies nicht aussortieren.How to re.search HTML-Quelle mit Regex in Python

Zahlen, Namen sind fiktiv. aber die Idee ist, wie diese

las ich einen Link wie ‚https://graph.facebook.com/123‘

dies führt zu Quellcode:

{ 
    "id": "123", 
    "name": "John Doe", 
    "first_name": "John", 
    "last_name": "Doe", 
    "link": "http://www.facebook.com/people/John-Doe/123", 
    "gender": "male", 
    "locale": "en_US" 
} 

Ich möchte alle extrahieren die Information von Identifikation, Name, usw.

Ich versuche, diese aber es funktioniert nicht

link = 'https://graph.facebook.com/123' 
    result = browser.open(link) 
    text = result.read() 
    result.close() 
    id = re.search('"id": "(.*?)",', cont) 

regex ' "id": "(. *?)",' Scheint korrekt zu sein, aber nothind zurückgegeben wird .. Warum ???

Antwort

7

Das scheint JSON, Sie wollen Regex nicht verwenden, um das zu analysieren.

link = 'https://graph.facebook.com/123' 
result = browser.open(link) 
data = json.load(result) 
print data['id'] 
+0

so verdammt einfach! tolle! Danke – user492741

+0

@ user492741, Sie sollten auf das Häkchen neben der Antwort klicken, um es zu akzeptieren. –