2017-03-19 5 views
-1

Ich suche nach einem Ansatz in NLP, wo ich einen Konzeptbaum aus einer Reihe von Schlüsselwörtern generieren kann.Wie man einen Konzeptbaum aus einer Reihe von Schlüsselwörtern generiert

Hier ist das Szenario, ich habe eine Reihe von Keywords aus einer Forschungsarbeit extrahiert. Jetzt möchte ich diese Schlüsselwörter in Form eines Baumes anordnen, in dem das allgemeinste Schlüsselwort oben ist. Auf der nächsten Ebene der Struktur werden Schlüsselwörter enthalten sein, die wichtig sind, um das Konzept der oberen Ebene zu verstehen, und sie werden spezifischer sein als die Schlüsselwörter der oberen Ebene. Und genauso wird der Baum wachsen.

So etwas wie diese: enter image description here

Ich weiß, es gibt viele Ressourcen, die mir dieses Problem zu lösen helfen kann. Wie Wikipedia dataset, Wordnet. Aber ich weiß nicht, wie ich mit ihnen verfahren soll.

Meine bevorzugte Programmiersprache ist Python. Kennen Sie eine Python-Bibliothek oder ein Paket, das dies erzeugt? Ich bin auch sehr interessiert zu sehen, die Verwendung von Machine Learning-Ansatz, um dieses Problem zu lösen. Ich werde Ihre Hilfe sehr schätzen.

+0

Wenn Sie diese Frage abstimmen wollen, dann hinterlassen Sie zumindest einen Kommentar und erklären Sie, was mit dieser Frage nicht stimmt. – Sherlock

Antwort

0

Eine Möglichkeit, das Problem zu betrachten, besteht darin, bei einer Reihe von Dokumenten Themen aus ihnen und auch die Abhängigkeiten zwischen den Themen zu identifizieren.

Wenn Sie zum Beispiel einige wissenschaftliche Arbeiten als Input haben (große Menge von Dokumenten), würde die Ausgabe die Themen sein, in denen sich die Artikel befinden und wie diese Themen in einer Hierarchie/Baumstruktur zusammenhängen. Ein Forschungsbereich, der dies anzugehen versucht, ist die hierarchische Topic-Modellierung, und Sie können mehr darüber lesen here und here.

Aber wenn Sie nur einen Baum aus einer Reihe von Schlüsselwörtern erstellen (die irgendwie erhalten werden) und keine anderen Informationen verfügbar sind, dann benötigt es Kenntnisse über reale Beziehungen und kann vielleicht ein regelbasiertes System sein wo definieren wir Math -> Algebra und so weiter.

Es gibt keine Möglichkeit für ein System zu verstehen, dass Algebra unter Mathe anders als durch Betrachten der großen Nr. Kommt. von Dokumenten und Schlussfolgerung dieser Beziehung (siehe ersten Vorschlag) oder wenn wir diese Beziehung manuell abbilden (vielleicht ein regelbasiertes System). So lernt sogar der Mensch diese Beziehungen.

Verwandte Themen