2016-06-02 7 views
1

Ziemlich neu in der Codierung, also ertragen Sie mich für grundlegende Fehler. Vereinfachte, ich habe dies:Parsen einer JSON-Datei mit BeautifulSoup

url = "https://www.youtube.com/browse_ajax?action_continuation=1&continuation=4qmFsgIuEiRWTFBMbFRwZUhIS2o1TFNpRVpKbXJxZGg0MHlqZjBmdG4xak4aBkNHVSUzRA%253D%253D" 

lm_json = requests.get(url).json() 

Wie würde ich über gehen lm_json mit BeautifulSoup Parsen? Ich bekomme immer Fehler, um es als Datei zu öffnen. Ich muss BeautifulSoup verwenden, weil ich das Ergebnis in einer while-Schleife verwende.

Von diesem Schritt müsste ich es an die Hauptsuppe anhängen.

Danke für jede Hilfe!

Antwort

1

Der HTML-Inhalt ist in eine JSON-Datei eingebettet. Für Ihr Beispiel können Sie versuchen:

url = "https://www.youtube.com/browse_ajax?action_continuation=1&continuation=4qmFsgIuEiRWTFBMbFRwZUhIS2o1TFNpRVpKbXJxZGg0MHlqZjBmdG4xak4aBkNHVSUzRA%253D%253D" 
lm_json = requests.get(url).json() 
soup = BeautifulSoup(lm_json["content_html"]) 
+0

Ich erhalte 'Attribute: 'dict' Objekt hat kein Attribut 'content_html'' EDIT: gerade versucht 'lm_soup = BeautifulSoup (lm_json [ 'content_html'])' und es scheint korrekt zu analysieren –