2016-10-28 2 views
1

Ich möchte den Text der Bearbeitung auf einer Wikipedia-Seite vor und nach der Bearbeitung erhalten. Ich habe diese url:API für Bearbeitung von Wikipedia

https://en.wikipedia.org/w/index.php?diff=328391582&oldid=328391343 

Aber, ich mag den Text im JSON-Format, so dass ich direkt in meinem Programm verwenden kann. Gibt es eine API von MediaWiki, die mir nach einer Bearbeitung den alten und neuen Text gibt oder muss ich die HTML-Seite mit einem Parser analysieren?

+0

Nun, es gibt eine Ausgabeoption im JSON-Format ... https://en.wikipedia.org/w/api.php?action=help&modules=json –

+0

Ich habe es versucht, aber es hat nicht funktioniert. – Hellboy

+0

Wie hast du es versucht? Verwenden der Vergleichs-API? https://en.wikipedia.org/w/api.php?action=help&modules=compare –

Antwort

1

Try this: https://www.mediawiki.org/wiki/API:Revisions

Es gibt ein paar Optionen, die nützlich sein können, wie zum Beispiel:

  1. rvparse: Revision Inhalt analysiert. Wenn diese Option verwendet wird, wird rvlimit aus Performancegründen auf 1 erzwungen.

  2. rvvifftotext: Text, an den jede Revision zu senden ist.

Wenn diese scheitern immer noch da ist

  1. rvprop/ids: Holen Sie sich das revid und von 1,16 vorwärts, die parentid

Dann, wenn Sie bekommen die Eltern-ID, können Sie den Text der beiden vergleichen.