Ich habe ein paar Millionen Entitäten mit 1 bis 10 Attribute beschreiben jeweils von ihnen und etwa einhunderttausend Klassen, um sie zu sortieren.Machine Learning Multiclass-Klassifizierung für Tausende von Klassen
Gibt es Machine Learning-Algorithmen (idealerweise verfügbar auf SQL Server, Azure oder als .NET-Bibliothek) oder eigenständige Tools für eine massive Multiclass-Klassifizierung, die die besten Klassen für die einzelnen Entitäten vorschlagen?
Ich habe diese Forschung in den Zeilen gefunden: Learning compact class codes for fast inference in large multi class classification, konnte aber keine Implementierungen finden.
Im Moment habe ich eine Art K-nearest neighbours basierend auf Full-Text Search mit ein paar anderen Dimensionen mit jeweils 1/3 gewichtet, um die Ergebnisse zu verbessern. Ich suche nach Wegen, um sowohl die Leistung als auch die Genauigkeit zu verbessern.
Für diejenigen, die die Frage als off-topic ablehnen: ** Ich glaube, dass in der Welt des maschinellen Lernens eine Diskussion der Algorithmeneignung für ein bestimmtes Szenario nicht mehr meineidig ist als eine Diskussion über [Wie kann ich überprüfen? Wenn eine Zeichenfolge eine andere Teilzeichenfolge enthält?] (http://stackoverflow.com/questions/1789945/how-can-i-check-if-one-string-contains-another-substring) in JavaScript. ** –