2017-11-03 5 views
1

Ich möchte einige Informationen aus unstrukturiertem Text extrahieren.So extrahieren Sie exakte Informationen aus unstrukturiertem Text

Zum Beispiel mein Text ist "Control NewYork Temperatur unter 39"

Die Informationen, die ich will, ist ("control", "NewYork", "Temperatur", "unter", "39").

In der Ergebnisinformation, "Kontrolle", die die Aktion darstellt, "NewYork", die das Aktionsziel darstellt, "Temperatur", die der Indikator und "unter 39" ist, die den Bereich darstellt.

Die Struktur des Textinhalts ist jedoch unterschiedlich.

Nachfolgend einige typische Fälle.

"Control NewYork temperature under 39" 
==>("control","NewYork", "temperature", "under", "39") 

"give some money to my brother" 
==>("give", "money", "my brother") 

"Adjust the height of the table" 
==>("adjust", "table", "height") 

Gibt es einen Vorschlag für mein Problem? Vielen Dank!

Antwort

0

Sie haben mehrere Paradigmen, um diese Art von strukturierter Vorhersage zu machen. Die häufigsten sind:

Verwenden Frame-Semantik: http://www.cs.cmu.edu/~ark/SEMAFOR/

Verwenden Semantic Role Kennzeichnung (SRL): http://cogcomp.org/page/demo_view/srl

Der Hauptunterschied ist, dass SRLs Semantic Rollen unterschiedliche Bedeutungen für verschiedene Verben haben, während Frame-Semantik ist eine Abstraktion, die generische Rollen für ein semantisches Konzept gibt.

Sie können leicht Tools finden, um Frame Semantic Parsing oder SRL auf Github zu tun. SRL wird jedoch häufiger verwendet

Verwandte Themen