Ich habe gerade ein Video angeschaut, in dem der Viterbi-Algorithmus verwendet wurde, um zu bestimmen, ob bestimmte Wörter in einem Satz Substantive/Verben/Adjs usw. sein sollen. Sie verwendeten Übergangs- und Emissionswahrscheinlichkeiten, zum Beispiel die Wahrscheinlichkeit, dass das Wort 'Time' verwendet wurde wie ein Verb bekannt ist (Emission) und die Wahrscheinlichkeit, dass ein Substantiv auf ein Verb führt (Transition).Wo finden Sie Viterbi-Algorithmus-Übergangswerte für die Verarbeitung natürlicher Sprache?
http://www.youtube.com/watch?v=O_q82UMtjoM&feature=relmfu (Video)
Wie kann ich einen guten Datensatz von Übergangs- und Emissionswahrscheinlichkeiten für diesen Anwendungsfall finden?
Oder sogar nur ein einziges Beispiel mit allen Wahrscheinlichkeiten angezeigt, möchte ich realistische Zahlen in einer Demonstration verwenden.