2017-12-18 3 views
-1

Ich möchte alle Links in der "Siehe auch" Abschnitt in einem Wikipedia-Artikel, aber Wikipedia API für Python (Wikipedia documentation) bietet diese Informationen nicht. Selbst wenn ich die Funktion "page" verwende, um den gesamten Inhalt einer Seite zu erhalten, um den Abschnitt "Siehe auch" zu extrahieren, ist dieser Abschnitt normalerweise leer! (Wenn Sie diese Seite mit Ihrem Browser ansehen, ist sie nicht leer!).Getting "Siehe auch" Abschnitt in einer Wikipedia-Seite

Nothing is appeared in "See also" section!

The "See also" section is not empty! Also, ich glaube, der einzige Weg, um die Informationen zum Extrahieren der HTML-Seite zu analysieren. Jeder Vorschlag, der mir hilft, diese Informationen zu extrahieren, ohne die HTML-Seite zu analysieren, wird geschätzt.

+0

Es ist lächerlich !!! ohne auch nur eine Zeile Kommentar zu erhalten, gaben mir zwei Personen nur negative Punkte !!!! – woody

Antwort

1

Scheint wie eine vernünftige Frage für mich. Wie auch immer, Sie müssen zwar immer noch HTML analysieren, aber die RESTBase-API bietet einen "mobile-sections" -Endpoint, der die Ausgabe HTML-nach-Abschnitt-Überschrift gruppiert. Der API-Endpunkt wie folgt aussieht:

https://en.wikipedia.org/api/rest_v1/page/mobile-sections/Facebook

Documentation provided here

Die API-Antwort enthält ein Objekt mit der Eigenschaft 'Abschnitte', wie dieser

"remaining": { 
    "sections": [ 
     { 
     "id": 39, 
     "text": ..., 
     "toclevel": 1, 
     "line": "See also", 
     "anchor": "See_also" 
     }, 
    ... 
    ] 
} 

Mit dieser Antwort können Sie die wählen HTML aus dem Abschnitt, dessen line-Eigenschaft mit der Zeichenfolge "Siehe auch" übereinstimmt.

Verwandte Themen