2016-06-22 9 views
-1

Ich muss eingehende Mietwagen klassifizieren, aber meine historischen Daten, die ich für das Training verwenden konnte, ist in "gruppierten" Form und ich kann nicht sehen, wie ich ein Klassifizierungsmodell trainieren könnte.Hinweise zur Klassifizierung Ansatz

Meine eingehenden Daten eine Liste der Auto-Modell, Menge und Stückpreis:

Chevrolet Spark, 1, 196.91 
Fiat 500, 1, 196.91 
Toyota Prius Hybrid, 3, 213.73 

Diese eingehenden Daten derzeit manuell klassifiziert und gespeichert wird nach Klasse und Gesamtpreis pro Gruppe gruppiert (Chevy und Fiat Economy ist, Prius ist Hybrid):

Economy, 393.82 
Hybrid, 641.19 

Dieses Problem wird durch maschinelles Lernen auflösbar sein sollte, aber ich kann nicht herausfinden, wie man einen Trainingssatz für einen beaufsichtigten Klassifikator zu bauen. Jede Anleitung geschätzt.

Dank

Antwort

0

Ein Bayes-Klassifikator tun sollten, was Sie versuchen können zu tun ... Sie den Preis nutzen, da die Taten aus zu bedienen und zu lernen, was bereits markiert.

Aber ich bekomme nicht, wie Sie konsistente Daten mit dem TOTAL-Preis haben können, um zu klassifizieren, da Sie nicht immer so viele Objekte von einer Gruppe zur anderen haben ... Sie müssten den Stückpreis verwenden.

+0

Das Problem ist, dass ich nichts getagged habe, habe ich nicht Fiat getaggt als Economy irgendwo anders als Benutzerkopf/auf Papier. Oder verstehe ich dich falsch? –

+0

@joe_c Können Sie nicht die Beispiele verwenden, die Sie bereits manuell als Zug-Set markiert haben? Edit: die Klassifizierung sind nur auf dem Papier? Personen, die das manuell klassifizieren, können das nicht auf einem Computer tun? – Carele

+0

Genau, es wurde und wird manuell gemacht und die Markierung wird nirgends gespeichert. Es ist so, weil die Daten auf Papier (Dutzende von Zeilen) kamen und anstatt viele Reihen zu lochen gruppieren sie es und registrieren nur ein paar gruppierte Reihen. –

0

Es gibt viele Algorithmen, die eine Klassifizierung mit mehreren Klassen ermöglichen, aber könnten Sie mehr über das, was Sie vorhersagen möchten, erklären? Nach dem, was Sie geschrieben haben, klingt es eher nach einem Szenario für einen ETL-Prozess als nach einem maschinellen Lernmodell.

Wenn ich Ihr Beispiel richtig verstehe, würde ein eingehender Rekord mit einem Automodell von "Chevy Spark" oder "Fiat 500" immer "Wirtschaft", während ein eingehender Rekord mit einem Automodell von "Toyota Prius Hybrid" wäre mit "Hybrid" gekennzeichnet. Eine einfache Nachschlagetabelle würde hier die Aufgabe erfüllen - keine Notwendigkeit für ausgefallene maschinelle Lernmathematik. :)

+0

Ich versuche, das Etikett des Autos basierend auf meinen historischen Daten vorherzusagen, die gruppiert sind (also habe ich nicht die sauberen Auto-> Etikettendaten, um die Suche aufzubauen). Sie haben Recht, Chevy Spark und Fiat 500 werden immer mit Economy etikettiert. Ich habe gehofft, dass ich ML benutzen kann, um das Label des Autos zu identifizieren :) –

Verwandte Themen