In Bag-of-Word-Modell, ich weiß, sollten wir Stoppwörter und Interpunktion vor dem Training zu entfernen. Aber sollte ich im RNN-Modell auch Stoppwörter entfernen, wenn ich eine Textklassifizierung durchführen möchte?Sollte ich Stoppwörter entfernen, wenn Satz zu RNN
0
A
Antwort
2
Dies hängt davon ab, was Ihr Modell klassifiziert. Wenn Sie etwas tun, bei dem die Klassifizierung durch Stoppwörter unterstützt wird - ein gewisses Maß an Syntaxverständnis - dann müssen Sie entweder die Stoppwörter beibehalten oder Ihre Stoppliste ändern, damit Sie nicht verlieren diese Information. Zum Beispiel kann das Ausschneiden aller Verben des Seins (ist, sind, sollte sein, ...) ein NN durcheinander bringen, das etwas von der Satzstruktur abhängt.
Wenn Ihre Klassifizierung jedoch themenbasiert ist (wie von Ihrer Bag-of-Word-Referenz vorgeschlagen), behandeln Sie die Eingabe auf die gleiche Weise: Entfernen Sie diese lästigen Stoppwörter, bevor sie wertvolle Trainingszeit verbrennen.
Verwandte Themen
- 1. So entfernen Sie Stoppwörter mit string.replace()
- 2. Python entfernen maßgeschneiderte Stoppwörter aus Pandas Dataframe
- 3. Wie Stoppwörter in diesem Code zu elimieren?
- 4. Was ist der richtige Weg NLTK Stoppwörter zu verwenden?
- 5. entfernen Element aus einem Satz nur, wenn Element in es
- 6. Beobachten tensorflow rnn Modell Gewichte
- 7. Wie Stoppwörter mit Stanford nlp
- 8. Python - wiederholte Wörter von der Webseite extrahieren und Stoppwörter entfernen
- 9. Schneller Weg Stoppwörter in Python
- 10. Sollte ich StorageFile aus CameraCaptureUI entfernen
- 11. Satz entfernen, der ein Element umschließt
- 12. Wenn Satz enthält Zeichenfolge
- 13. MySQL Volltext Stoppwörter Problem
- 14. Können Stoppwörter automatisch gefunden werden?
- 15. Tensorflow RNN Schicht Fehler
- 16. Wo sollte ich einen Benachrichtigungsbeobachter entfernen?
- 17. MySQL Volltext Stoppwörter Begründung
- 18. Sollte ich einen Event-Handler entfernen?
- 19. Was sollte ich in den Satz tun und was sollte mein Zustand sein?
- 20. Entfernen von Werten aus Satz im Batch
- 21. Codename ein Satz entfernen Akkordeon Grenze
- 22. JPA wenn ich Entity Manager schließen sollte
- 23. Satz basierten Ansatz entfernen enthaltenen Punkte
- 24. Wie verwende ich RegExp Replace, um den Satz zu ersetzen?
- 25. NLTK und Stoppwörter fehlgeschlagen #lookuperror
- 26. leeren Standardfall in Teilschalter vs wenn Satz
- 27. Entfernt die ContentSearch-API von Sitecore 7 Stoppwörter von Abfragen?
- 28. Grails gehört zu, sollte ich?
- 29. Warum bekomme ich einen Keras LSTM RNN input_shape Fehler?
- 30. Sollte ich zu ASP.NET wechseln?