2017-08-08 2 views

Antwort

2

Es gibt keinen einzigen Algorithmus für Extraktion basierte Zusammenfassung. Es gibt mehrere verschiedene Algorithmen zur Auswahl. Sie sollten eine auswählen, die Ihren spezifischen Bedürfnissen entspricht.

Es gibt zwei Ansätze basieren Verdichtung der Extraktion:

  • beaufsichtigte Lernen - Sie geben die Programm viele Beispiele von Dokumenten zusammen mit ihren Schlüsselwörtern. Das Programm lernt, was ein Keyword ausmacht. Dann geben Sie ein neues Dokument, diesmal ohne Keywords, und das Programm extrahiert die Schlüsselwörter dieses Dokuments basierend auf dem, was es während der Trainingsphase gelernt hat. Es gibt eine große Anzahl von überwachten Lerntechniken. Um nur einige zu nennen, gibt es neuronale Netze, Entscheidungsbäume, Random Forests und Support Vector Machines.

  • Unüberwachtes Lernen - Sie geben dem Programm einfach ein Dokument und es erstellt eine Liste von Schlüsselwörtern, ohne auf irgendwelche früheren Erfahrungen zurückzugreifen. Ein beliebter unüberwachter Algorithmus zur extraktionsbasierten Zusammenfassung ist TextRank.

0

Zuerst einmal, ich denke, Sie sollten mehr darüber lernen, wie man Papiere und Forschung findet. Es ist absolut unmöglich, wenn Sie nichts durch Google gefunden haben. In jedem Fall sind einige der Extraktion basierten Text summarziation:

  1. Einfache Methoden zu implementieren, basierend auf Wortfrequenz
  2. Bayes-Methoden
  3. Graph basierten Methoden, zB TextRank/LexRank ist ein guter Anfang.
  4. Clustering
  5. Fuzzy-Systeme für die Zusammenfassung
  6. Neural Network basierendes System
  7. I Methoden haben gesehen, basierend auf Optimierungsalgorithmen
    ich diese Methoden empfehlen googeln und sehen, was Sie erhalten. Es gibt viele Variationen für diese und ich kann nicht wirklich sagen, welche Methode die beste ist. Denken Sie daran, auch die richtigen Vorverarbeitungswerkzeuge zu finden.
    Viel Glück.