Angenommen, ich habe eine Standortfunktion. Im Zugdatensatz sind seine einzigartigen Werte "NewYork", "Chicago". Aber im Test-Set hat es "New York", "Chicago", "London". Also beim Erstellen eines Hot-Encoding wie "London" zu ignorieren? Mit anderen Worten, wie werden die Kategorien, die nur im Testset erscheinen, nicht codiert?Wie behandelt man unsichtbare kategoriale Werte in Testdatensätzen mit Python?
2
A
Antwort
0
Angenommen, dies Ihre Listen
train_data = ['NewYork', 'Chicago']
test_set = ['NewYork', 'Chicago', 'London']
Basierend auf Ihrer Frage zu sein:
Wie nicht um die Kategorien zu kodieren, die nur in dem Test-Set erscheinen?
for each in test_set:
if filter(lambda element: each in element, train_data):
print each
Diese Ausgänge NewYork
& Chicago
, was bedeutet London
übersprungen.
Verwandte Themen
- 1. Wie entfernt man unsichtbare Elemente in SVG-Dateien mit Python?
- 2. Wie behandelt man leere Werte in Konfigurationsdateien mit ConfigParser?
- 3. Wie behandelt man Null-Werte in linq?
- 4. Wie behandelt man 'NULL' Werte in SparkSQL?
- 5. Wie behandelt man Fehler mit Python?
- 6. Wie behandelt man Anführungszeichen in Python Argument
- 7. Wie behandelt man den KeyError in Python?
- 8. Hierarchisches Clustering für kategoriale Daten in Python
- 9. SQL: Wie behandelt man ähnlich klingende Werte wie in Oracle?
- 10. Wie behandelt man Python-Pakete mit in Konflikt stehenden Namen?
- 11. Wie behandelt man Strg + C in Python-App mit PyQt?
- 12. Kategoriale Werte auf der x-Achse mit xlsxwriter
- 13. Wie behandelt man Unicode-Werte in JSON-Strings?
- 14. Wie behandelt man die Internationalisierung mit Selenium WebDriver mit Python?
- 15. Python Pandas GROUPBY über kategoriale Variablen
- 16. Python Convert Kontinuierliche Daten in kategoriale
- 17. Qt: Wie korrigiert man unsichtbare/versteckte Widgets?
- 18. Wie behandelt man Rechtschreibfehler in UnigramTagger in Nltk Python?
- 19. Wie man MySQL-Verbindung (en) mit Python Multithreading behandelt
- 20. Wie behandelt man utf-8 Text mit Python 3?
- 21. Wie behandelt man Codierungen mit Python Requests Bibliothek
- 22. Wie behandelt man C-Erweiterungen für Python-Anwendungen mit Pip?
- 23. Wie behandelt man diesen Alarm oder Frame mit Python Selen?
- 24. Kategoriale Variablen in TensorFlow
- 25. Wie behandelt Python Speicher?
- 26. Wie behandelt man Ausnahmen?
- 27. Wie behandelt man eine defekte Pipe (SIGPIPE) in Python?
- 28. Wie behandelt man Abfragen in der REST-API [python]
- 29. Wie behandelt man ValueError: ungültiges Literal für float() in Python
- 30. Wie behandelt man complexType Argumente in Python-Soap-Modul Zeep?