1

Ich möchte irgendwie Art Informationen aus Wikipedia extrahieren. Zum Beispiel möchte ich finden:Wie extrahiert man Informationen (z. B. Typen und Subtypen) aus Wikipedia?

  • Liste aller „Carolina Panthers Spieler“
  • Liste aller „Farben“
  • Liste aller „NFL-Teams“
  • Liste aller „Monat“

Irgendwelche Ideen, wenn es einen sauberen Weg gibt, dies zu tun?

Natürlich ist eine Alternative die API zu verwenden, aber soweit ich weiß, ist es nicht trivial, die vorhandene API zu verwenden, um solche Informationen aus Wiki zu extrahieren.

+0

Kennen Sie DBpedia? Würde das für dich funktionieren? – unor

+0

@unor ja. Denkst du, dass DBpedia besser funktioniert als MediaWiki api? Oder es könnte robuster sein? – Daniel

+1

Ich bin mir nicht sicher (ich habe die API noch nie benutzt), ich wollte nur klarstellen, ob Sie das in Betracht gezogen haben. – unor

Antwort

0
1

Es scheint, wie Sie alle Kategorien aus Wikipedia extrahieren müssen und die Kategorie Taxonomie zu bauen. Sobald Sie die Kategorietaxonomie erstellt haben, können Sie auch verwandte Kategorien abrufen.

Mithilfe von Kategorieinformationen können Sie auch alle Wikipedia-Artikel abrufen, die einer bestimmten Kategorie zugeordnet sind.

Ich glaube mein Projekt auf mining Wikipedia kann Ihnen in dieser Hinsicht helfen. Ich habe Informationen über Wikipedia-Artikel und -Kategorien vorverarbeitet, die öffentlich verfügbar sind.

Verwandte Themen