2010-12-09 9 views
1

Ich baue eine Anwendung, die Sie zu Themen, die Sie möchten, wählen, sollten diese Themen in DB sein.Liste der Seiten von wikipedia

Es gibt Millionen "Likes"! (Pizza, PHP, Manchester United, irgendeinen Film .. ich weiß es nicht), also habe ich beschlossen, diese "Likes" in meine DB mit Wikipedia einzufügen.

Nun, es gibt eine Möglichkeit, all diese "Likes" zu bekommen (mit der API habe ich ein Limit [500 pro Suche denke ich)? oder eine andere Lösung?

Vielen Dank.

+1

Ich möchte nur Liste der Seiten von Wikipedia erhalten. Auf meiner Website kann der Benutzer auswählen, was er möchte. (aus der Liste) – Luis

+0

Ich bin mir ziemlich sicher, dass es dutzende Fans von: http://en.wikipedia.org/wiki/23155_Judithblack oder http://en.wikipedia.org/wiki/California_Sekretary_of_State_election,_2006 – Mchl

+0

Warum? nicht wie gewohnt, dh Benutzer manuell neue Likes eingeben, wenn sie etwas auf der Liste der vorhandenen nicht finden können? – Mchl

Antwort

1

Werfen Sie einen Blick auf die technische Dokumentation der WikiMedia. Es gibt einen Abschnitt, der über query continuation spricht.

Alternativ können Sie eine Wikipedia-Dump herunterladen, Ihre eigene Kopie von WikiMedia installieren und nach Herzenslust abfragen. Die Speicherauszüge sind riesig, aber abhängig davon, wie viel Material Sie extrahieren möchten, kann dies die Aufgabe schneller und mit weniger Auswirkungen auf den Wikipedia-Dienst beenden.

+0

Gibt es eine Möglichkeit, die Liste der Seitentitel einfach zu erhalten, ohne den gesamten XML-Dump herunterzuladen? –

1

Es ist ein wenig unklar, welche Informationen Sie tatsächlich aus Wikipedia abrufen möchten. Seitentitel?

Wikimedia stellt XML-Dateien mit allen Seitentiteln für alle ihre Projekte unter download.wikimedia.org zur Verfügung. (Leider scheinen die Dumps aufgrund von Hardwareproblemen momentan nicht verfügbar zu sein). Sie könnten die XML-Datei analysieren und alle Titel in Ihrer eigenen Datenbank speichern.

+0

Wird es verfügbar sein? :-) Weil ich denke, es ist nicht verfügbar lange Zeit .. – Luis

0

Dumps sind in verschiedenen Formaten mit unterschiedlichen Detaillierungsgraden aus Wikipedia verfügbar.

Wählen Sie eine, die Ihren Anforderungen am besten entspricht, und parsen Sie sie.

+0

Sie meinen http://en.wikipedia.org/wiki/Wikipedia:Datenbank_download? Links funktionieren nicht. – Luis

+0

@Paul: Ich bin interessiert von solchen Dump "mit verschiedenen Ebenen von Details". Können Sie einen Link bereitstellen? – Hugolpz

Verwandte Themen