Ich habe ein vortrainiertes word2vec-Modell für meine Muttersprache heruntergeladen. Es hatte eine „news.model.bin“ Datei und wenn ich es entpackt, eine txt
Datei oder pickle
sehen erwartet, aber ich fand einen anderen .bin
Datei in es mit einem Chaos consistat wie folgt aus:Laden von ".bin" in Theano oder TensorFlow
\09\b9\.,-;sdfkf %some really strange symbols and seem to be invalid symbols%
I kann es nicht einmal kopieren, weil ich die Datei normalerweise nicht öffnen kann - es ist schwer und mein Laptop stirbt einfach. Die Frage ist: Kann dieser Beispielcode ein Pre-Tranes-Modell sein oder nicht? Wenn ja - wie soll ich damit umgehen?
P.S. Der Link, wo ich das Modell bekam aus (Modelle sind am unteren Rand der Seite): http://ling.go.mail.ru/dsm/ru/about
Eine schnelle Google drehte [diese] (http://mccormickml.com/2016/04/12/googles-pretrained-word2vec- Modell-in-Python /). Ich denke, es ist ein spezialisiertes Format für Word2vec. Ich hoffe es hilft. – Kh40tiK
Mögliches Duplikat von [Word2vec-Bin-Datei in Text umwandeln] (http://stackoverflow.com/questions/27324292/convert-word2vec-bin-file-to-text) –