2012-04-03 3 views
0

Ich habe Wikipedia neuesten Dump heruntergeladen und analysiert es eine MySQL-Datenbank. Jetzt habe ich Datenbanktabelle, die nur Titel und Inhalt enthält. Meine Anforderung ist, alle Biographieinhalte von dieser Tabelle zu extrahieren. So will ich eine Speicherabzugsdatei, die alle Biographietitel hat. Vielen Dank im VorausZugriff auf Titel von Biografien in Wikipedia

+0

Es gibt eine Datenbanktabelle, die nur Titel und Inhalt zu diesem Titel enthält. Dies habe ich aus dem Parsen von enwiki-articles-last.xml. Aber meine Anforderung besteht darin, nur Inhalte zu erwerben, die mit dem Titel der Kategorie Biografie in Zusammenhang stehen. Wenn ich eine Liste aller Biographien in Wikipedia habe, kann ich Inhalte aus meiner Datenbanktabelle abrufen. –

Antwort

0

Wenn Sie alle Artikel in irgendeiner Kategorie zu bekommen und alle Unterkategorien, müssen Sie the categorylinks table verwenden und sie gehen rekursiv Artikel in den Unterkategorien zu erhalten.

Es ist nicht klar aus Ihrer Frage, was genau Sie wollen. Wenn Sie Artikel über Biografien wollen, sehen Sie sich Category:Biography. Wenn Sie möchten, dass Artikel, die sind Biographien, schauen Sie unter Unterkategorien von Category:People.

+0

Ich brauche Artikel über Menschen.Kann ich alle Artikel Themen in Wikipedia im Zusammenhang mit Menschen.Wie eine Mysql-Dump –

+0

Nein, müssen Sie durch die Kategorie selbst Baum gehen. – svick

Verwandte Themen