meine Aufgabe ist es Tags (beschreibende Wörter) zu Dokumenten oder Beiträge aus der Liste der verfügbaren Tags zuweisen. Ich arbeite mit Doc2vec in Gensim. Ich habe gelesen, dass doc2vec für das Dokumenten-Tagging verwendet werden kann. Aber ich konnte die passenden Parameterwerte für diese Aufgabe nicht bekommen. Bis jetzt habe ich es getestet, indem ich den Wert der Parameter 'Größe' und 'Fenster' geändert habe. Die Ergebnisse, die ich erhalte, sind zu Unsinn und auch durch Ändern der Werte dieser Parameter habe ich keinen Trend in Ergebnissen gefunden, d.h. bei einigen Werten wurden die Ergebnisse etwas verbessert und bei einigen Werten fielen die Ergebnisse. Kann jemand vorschlagen, welche Parameterwerte für diese Aufgabe geeignet sein sollten? Ich fand, dass "Größe" (definiert Größe wenn Feature-Vektor) groß sein sollte, wenn wir genug Trainingsdaten haben. Aber über den Rest der Parameter werde ich nicht sicher!Parameterwerte von Doc2vec für Document Tagging - GENSIM
0
A
Antwort
0
Welche Parameter sind am besten mit der Qualität & Größe Ihrer Trainingsdaten variieren kann, und genau das, was Ihre Downstream-Ziele sind. (Es gibt keinen Satz von Best-for-Everything-Parametern.)
Starten mit dem Gensim-Standard ist vernünftig erste Schätzung, oder andere Werte, die Sie gesehen haben, jemand anderes erfolgreich auf einem ähnlichen Datensatz/Problem verwendet.
Aber wirklich müssen Sie experimentieren, idealerweise durch Erstellen einer automatisierten Auswertung auf der Grundlage einiger zurückgehaltenen Test-Set, dann Meta-Optimierung der Doc2Vec
Parameter durch die Suche über viele kleine Anpassungen der Parameter für die besten Bereiche/Kombinationen .
Verwandte Themen
- 1. Aktualisieren von Schulungsunterlagen für Gensim Doc2Vec Modell
- 2. gensim doc2vec "intersect_word2vec_format" Befehl
- 3. GENSIM Doc2Vec - Pass corpus Sätze Doc2Vec Funktion
- 4. GENSIM doc2vec Dokumente nicht von id
- 5. Doc2Vec Gensim Ähnlichkeit zwischen Dokument und Thema
- 6. gensim doc2vec geben nicht festgestellten Ergebnis
- 7. Gensim Doc2vec Modell Clustern in K-bedeutet
- 8. Gensim: Wie man vortrained doc2vec Modell lädt?
- 9. Probleme in Doc2vec-Tags in Gensim
- 10. Ist es möglich, Gensim doc2vec für die Klassifizierung zu verwenden
- 11. Gensim Doc2Vec generiert riesige Datei für das Modell
- 12. Wie verwendet man Gensim Doc2vec infer_vector() für große DataFrame?
- 13. Wie bekomme ich den Dokumentenvektor von Doc2Vec in Gensim 0.11.1?
- 14. Gensim Doc2Vec Modell erzeugt nur eine begrenzte Anzahl von Vektoren
- 15. Wie man Wortvektoren von einem Gensim Doc2Vec erhält?
- 16. Verwenden von Gensim doc2vec mit Keras Conv1d. ValueError
- 17. GENSIM - LDA erstellen document- Thema Matrix
- 18. GENSIM Doc2Vec Ausnahme Attribute: ‚str‘ Objekt hat kein Attribut ‚Worte‘
- 19. Updates der Dokument Vektoren in Doc2vec (PV-DM) in Gensim
- 20. Gensim: Was ist der Unterschied zwischen Word2vec und Doc2vec?
- 21. Python Gensim ursprüngliche Sätze aus doc2vec abholen etikettiertes Dokument
- 22. Gensim: Fehler beim Laden des vortrainierten doc2vec Modells?
- 23. doc2vec - Eingabeformat für doc2vec Ausbildung und infer_vector() in Python
- 24. Warum gibt mir Gensim Doc2Vec verschiedene Vektoren für den gleichen Satz?
- 25. Got EOFError beim Laden von doc2vec Modell
- 26. Visualization word2vec generiert von Gensim
- 27. laden vortrainiert word2vec Modell für doc2vec
- 28. Python einfache Implementierung von Doc2vec?
- 29. Warum Gensim doc2vec AttributeError geben: 'list' Objekt hat kein Attribut 'words'?
- 30. Gensim Segmentierung Fehler