Ich plane den Aufbau eines Geschlechtsklassifikators. Ich weiß, dass die zwei populären Modelle tf-idf und word2vec sind. Während sich tf-idf auf die Bedeutung eines Wortes in einem Dokument und die Ähnlichkeit von Dokumenten konzentriert, konzentriert sich word2vec mehr auf die Beziehung zwischen Wörtern und deren Ähnlichkeit.Welche Methode sollte ich verwenden, um Wörter in Funktionen für Machine Learning-Anwendungen zu konvertieren?
Allerdings scheint keines der Themen perfekt für den Aufbau von Vektorfunktionen zu sein, die für die Geschlechterklassifizierung verwendet werden. Gibt es ein anderes alternatives Vektorisierungsmodell, das für diese Aufgabe geeignet ist?
Eine Frage. Unterstützt Glove Hindi? Enthält eines der vortrainierten Modelle Hindi-Daten? – Djokester
@Djokester Wenn Sie über Hindi geschrieben in Englisch sprechen, dann glaube ich, dass es das unterstützen wird. Allerdings, tatsächliche Hindi-Skript? Kann ich nicht sagen. Ich habe es noch nie zuvor versucht. Einen Versuch ist es wert. Außerdem gibt es meines Wissens keine vorgefertigten Modelle von Hindi. –
Gibt es ein Python-Paket für GloVe? Ich habe keinen zuverlässigen gefunden. – Djokester