2010-12-28 9 views
1

Welche Techniken existieren, die den Unterschied zwischen einfachen allgemeinen Phrasen wie "zu dem", "und dem" unterscheiden und Sätze und Idiome setzen können, die ihre eigenen lexikalischen Bedeutungen haben wie "aufheben", "verlieben", " Hering "," Sackgasse "?Wie man Idiome ißt und Phrasen durch NLP-Techniken von anderen üblichen Phrasen unterscheidet?

Gibt es Techniken, die auch ohne Wörterbuch erfolgreich sind? Statistische Methoden HMMs trainieren zum Beispiel auf großen Korpora?

Oder gibt es Heuristiken wie das Ignorieren oder die Gewichtung von "promiskuitiven" Wörtern, die zusammen mit fast jedem Wort auftreten können, im Gegensatz zu Wörtern, die entweder alleine oder in einer bestimmten begrenzten Menge von idiomatischen Phrasen vorkommen?

Wenn es solche Heuristiken gibt, wie berücksichtigen wir Satzsätze und verbale Ausdrücke, die promiskuitive Wörter wie "oben" in "schlagen", "auffressen", "aufsetzen", "überlegen" enthalten "?

UPDATE

Ich habe ein interessantes Papier online gefunden: Unsupervised Type and Token Identification of Idiomatic Expressions

Antwort

2

Sie sind für Kollokations Erkennung suchen?

Schauen Sie sich this Kapitel in dem ausgezeichneten Buch, Grundlagen der natürlichen Sprachverarbeitung von Manning & Schütze.

+0

Gut Kollokationen sind ein breiteres Feld als Idiome, aber schmaler als allgemeine Phrasen, also danke für den Link. – hippietrail

Verwandte Themen