Ich habe versucht, StanfordSegmenter zu verwenden, um ein Stück Chinesisch zu segmentieren, stieß jedoch auf das Problem mit der Überschrift. Ich heruntergeladen erste Stanford-Word-Segmentierer Version 3.5.2 von http://nlp.stanford.edu/software/segmenter.shtmlFehler: Hauptklasse konnte nicht gefunden oder geladen werden edu.stanford.nlp.ie.crf.CRFClassifier
Dann habe ich eine Python geschrieben:
import os
os.environ['JAVAHOME'] = "C:/Program Files/Java/jdk1.8.0_102/bin/java.exe"
from nltk.tokenize.stanford_segmenter import StanfordSegmenter
segmenter = StanfordSegmenter(path_to_jar = "./stanford-segmenter-2015-12-09/stanford-segmenter-3.6.0.jar",
path_to_slf4j = "./stanford-segmenter-2015-12-09/slf4j-api.jar",
path_to_sihan_corpora_dict = "./stanford-segmenter-2015-12-09/data",
path_to_model = "./stanford-segmenter-2015-12-09/data/pku.gz",
path_to_dict = "./stanford-segmenter-2015-12-09/data/dict-chris6.ser.gz")
sentence = u"这是斯坦福中文分词器测试"
segmenter.segment(sentence)
Aber ich habe folgende Fehlermeldung:
Error: Could not find or load main class edu.stanford.nlp.ie.crf.CRFClassifier
Wo habe ich Fehler machen? Vielen Dank.