Automatische Zusammenfassung: Extraktion basiert

-5

Was ist der Algorithmus der Extraktion basierte automatische Zusammenfassung? viel gegoogelt, konnte nichts im Zusammenhang damit finden. Ich möchte die Algo auf Python implementierenAutomatische Zusammenfassung: Extraktion basiert

Quelle

2017-08-08 Daniyal Javaid

Es gibt keinen einzigen Algorithmus für Extraktion basierte Zusammenfassung. Es gibt mehrere verschiedene Algorithmen zur Auswahl. Sie sollten eine auswählen, die Ihren spezifischen Bedürfnissen entspricht.

Es gibt zwei Ansätze basieren Verdichtung der Extraktion:

beaufsichtigte Lernen - Sie geben die Programm viele Beispiele von Dokumenten zusammen mit ihren Schlüsselwörtern. Das Programm lernt, was ein Keyword ausmacht. Dann geben Sie ein neues Dokument, diesmal ohne Keywords, und das Programm extrahiert die Schlüsselwörter dieses Dokuments basierend auf dem, was es während der Trainingsphase gelernt hat. Es gibt eine große Anzahl von überwachten Lerntechniken. Um nur einige zu nennen, gibt es neuronale Netze, Entscheidungsbäume, Random Forests und Support Vector Machines.
Unüberwachtes Lernen - Sie geben dem Programm einfach ein Dokument und es erstellt eine Liste von Schlüsselwörtern, ohne auf irgendwelche früheren Erfahrungen zurückzugreifen. Ein beliebter unüberwachter Algorithmus zur extraktionsbasierten Zusammenfassung ist TextRank.

Quelle

2017-08-08 15:31:56

Zuerst einmal, ich denke, Sie sollten mehr darüber lernen, wie man Papiere und Forschung findet. Es ist absolut unmöglich, wenn Sie nichts durch Google gefunden haben. In jedem Fall sind einige der Extraktion basierten Text summarziation:

Einfache Methoden zu implementieren, basierend auf Wortfrequenz
Bayes-Methoden
Graph basierten Methoden, zB TextRank/LexRank ist ein guter Anfang.
Clustering
Fuzzy-Systeme für die Zusammenfassung
Neural Network basierendes System
I Methoden haben gesehen, basierend auf Optimierungsalgorithmen
ich diese Methoden empfehlen googeln und sehen, was Sie erhalten. Es gibt viele Variationen für diese und ich kann nicht wirklich sagen, welche Methode die beste ist. Denken Sie daran, auch die richtigen Vorverarbeitungswerkzeuge zu finden.
Viel Glück.

Quelle

2017-10-03 16:04:27 Guardian

Automatische Zusammenfassung: Extraktion basiert

Antwort

Verwandte Themen