Ich habe Wikipedia neuesten Dump heruntergeladen und analysiert es eine MySQL-Datenbank. Jetzt habe ich Datenbanktabelle, die nur Titel und Inhalt enthält. Meine Anforderung ist, alle Biographieinhalte von dieser Tabelle zu extrahieren. So will ich eine Speicherabzugsdatei, die alle Biographietitel hat. Vielen Dank im VorausZugriff auf Titel von Biografien in Wikipedia
Antwort
Wenn Sie alle Artikel in irgendeiner Kategorie zu bekommen und alle Unterkategorien, müssen Sie the categorylinks
table verwenden und sie gehen rekursiv Artikel in den Unterkategorien zu erhalten.
Es ist nicht klar aus Ihrer Frage, was genau Sie wollen. Wenn Sie Artikel über Biografien wollen, sehen Sie sich Category:Biography. Wenn Sie möchten, dass Artikel, die sind Biographien, schauen Sie unter Unterkategorien von Category:People.
Ich brauche Artikel über Menschen.Kann ich alle Artikel Themen in Wikipedia im Zusammenhang mit Menschen.Wie eine Mysql-Dump –
Nein, müssen Sie durch die Kategorie selbst Baum gehen. – svick
- 1. Zugriff auf Wikipedia-API mit JSONP
- 2. Android Studio - SAXParseException beim Zugriff auf Wikipedia-Seite
- 3. Wikipedia api Volltextsuche zurück Artikel mit Titel, Schnipsel und Bild
- 4. So erhalten Sie eine Liste der Titel aller Wikipedia-Artikel
- 5. Größenanpassung Animation auf wikipedia
- 6. Scala Verschlüsse auf wikipedia
- 7. Speicherleck in Java (Wikipedia)
- 8. Zugriff auf iPod-Bibliothek Titel in iOS 4?
- 9. Unterkategorien von Wikipedia-Seiten
- 10. Wikipedia: Java-Bibliothek zum Entfernen von Wikipedia-Text Markup-Entfernung
- 11. COM-Schnittstelle für den Zugriff auf Dateiinformationen (Titel, Thema, Autor)?
- 12. Wikipedia Kategorie Hierarchie von Dumps
- 13. Liste der Seiten von wikipedia
- 14. Wikipedia Mediawiki API pageId von URL bekommen
- 15. Extrahieren von Titel von Link in R
- 16. Extrahieren von Daten aus Wikipedia API
- 17. Java Multilateration Implementierung basierend auf Wikipedia Gleichungen
- 18. kann nicht wikipedia API für den Zugriff auf durch SSL-Zertifikat Fehler
- 19. Wie Extrakte für alle zurückgegebenen Seiten von Wikipedia API erhalten?
- 20. Wikipedia-API für geolocations
- 21. Wikipedia API für Python
- 22. Alle Wikipedia-Artikel mit Koordinaten innerhalb von London erhalten
- 23. Wikipedia Text herunterladen
- 24. Suche nach einem Titel auf iTunes
- 25. Wikipedia API infobox
- 26. Abrufen von zufälligen Artikeln aus Wikipedia
- 27. Wikipedia-Integration. Wie?
- 28. Grenzen der Wikipedia API
- 29. den Inhalt von Wikipedia JSON-Datei
- 30. Extrahieren von Formeln aus Wikipedia-Seiten - Python
Es gibt eine Datenbanktabelle, die nur Titel und Inhalt zu diesem Titel enthält. Dies habe ich aus dem Parsen von enwiki-articles-last.xml. Aber meine Anforderung besteht darin, nur Inhalte zu erwerben, die mit dem Titel der Kategorie Biografie in Zusammenhang stehen. Wenn ich eine Liste aller Biographien in Wikipedia habe, kann ich Inhalte aus meiner Datenbanktabelle abrufen. –