2017-01-11 4 views
1

Ich bin ziemlich neu im maschinellen Lernen, aber ich versuche das folgende Problem zu lösen. Es ist eine Art umgekehrte Vorhersage. Ich habe viele Eingaben und dementsprechend für jeden Datensatz einen Ausgang. So konnte ich leicht eine Klassifizierung vornehmen und die Ausgabe für eine unbekannte neue Datenmenge vorhersagen. Das Problem, das ich gerne lösen würde, ist ein erwartetes Ergebnis zu nehmen und eine Klassifizierung des Satzes von Eingabedaten zu erhalten, die mit einer sehr hohen Wahrscheinlichkeit zu der erwarteten definierten Ausgabe gelangen.Wie man eine umgekehrte Vorhersage mit maschinellem Lernen durchführt?

Um das Problem komplexer zu machen, möchte ich die Flexibilität haben, einige der Eingabekriterien zu definieren, die wahrscheinlich nicht veränderbar sind (zB männlich/weiblich) und diese Kriterien wie Filter hinzufügen und eine neue Umkehrvorhersage erhalten wäre der relevanteste wichtige Input neben dem gegebenen, um mit einem erwarteten und definierten Ergebnis zu enden.

Lassen Sie uns ein Beispiel geben: Ich habe Tausende von Aufzeichnungen von Studenten einschließlich Bildung usw. und die Informationen, wenn sie nach 10 Jahren Berufserfahrung normales oder extremes Geld verdienen. Also, wenn ich ein neuer Student bin, könnte ich das Ergebnis vorhersagen, wenn ich eine Menge Geld oder Durchschnitt verdienen werde, basierend auf meiner Ausbildung, meinem Geschlecht, Alter bei Abschluss, was ich studiere usw. was ich gerne bekommen würde ist die Tatsache gegeben dass ich männlich bin und zum Zeitpunkt des Abschlusses ein erwartetes Alter habe, was sollte ich studieren, um eine hohe Wahrscheinlichkeit zu haben, extrem zu verdienen?

Antwort

0

Dieses Problem hat keine einzigartige oder optimale Lösung, obwohl es auf verschiedene Arten gelöst werden kann, IMO.

Die wichtigste Tatsache zu verstehen ist, dass Sie einen Verlust von Informationen von der Vektoreingabe in die skalare/kategorische Ausgabe haben. Es ist keine "invertible" oder "reversible" Transformation, da mehrere und sehr unterschiedliche Input-Vektoren zu demselben Ausgabewert führen können, wodurch die Informationskomponente verwässert wird.

Gesagt, dass ein möglicher Angriffswinkel für das Problem wäre, Ihre Eingabevektoren zu clustern, um mehrere relevante Cluster für jeden Ausgabewert zu erhalten. Dann könnten Sie diese Eingangsclusterzentren extrahieren und prüfen, welche prototypischen Werte zu dem gewünschten Ergebnis führen. Auf diese Weise haben Sie Ihre gewünschten umgekehrten Eingangspunkte von Interesse.

Verwandte Themen