2009-04-23 4 views
0

Gibt es ein einfach zu bedienendes Python-Modul, das eine englische oder finnische Textüberprüfung durchführt?Englische und/oder finnische Textvalidierung

Es wäre in Ordnung, wenn ich einfach überprüfen könnte, ob die Wörter im benutzerdefinierten Wörterbuch vorhanden sind und möglicherweise überprüfen, ob die Grammatik etwas in Ordnung ist.

Ich plane, eine ausgefallene Validierung für einen Verzeichnisinhalt zu implementieren, den ich vorhin zurück gemacht habe. Dies beinhaltet einige einfache Dinge wie das Überprüfen, dass die Konfigurationsskripte nicht abstürzen und alles gut macht. Ansonsten ist alles ganz einfach.

Für den Validator sollte ich nur ganze Dateien oder Strings Unicode-Text eingeben können.

Antwort

2

Ich bin mir nicht sicher, was Sie zu tun versuchen, aber wenn Sie nach etwas suchen, das sagen kann "das ist gültig Englisch" oder "das ist gültig Finnisch", dann sehen Sie sich eine Klasse an von Problemen, die sehr wahrscheinlich unlösbar sind.

Wenn nicht, dann verwenden Sie ein Wörterbuch und/oder Buchstaben Häufigkeiten und Bayesian-Analyse, um zu bestimmen, ob gegebener Text Englisch-ähnlich oder Finnisch-ähnlich ist. Wenn Sie versuchen, eine Sprache automatisch zu erkennen, ist dies wahrscheinlich die beste Route, auch wenn Sie Probleme mit Texten in mehreren Sprachen haben.

Verwandte Themen