Kennt jemand von Ihnen eine Methode des maschinellen Lernens oder eine Kombination von Methoden, die es ermöglicht, Vorwissen in den Entscheidungsfindungsprozess zu integrieren?Methode zum maschinellen Lernen, die in der Lage ist, Vorwissen in einen Entscheidungsbaum zu integrieren
Mit „Vorwissen“ Ich meine die Information, ob ein Merkmal in einem bestimmten Knoten wirklich verantwortlich für die daraus resultierende Einstufung ist oder nicht. Stellen Sie sich vor, wir haben nur eine kurze Zeitspanne, in der unsere Merkmale gemessen werden, und in dieser Zeit haben wir eine Korrelation zwischen den Merkmalen. Wenn wir jetzt die gleichen Merkmale wieder messen würden, würden wir wahrscheinlich nicht eine Korrelation zwischen diesen Funktionen erhalten, weil es nur ein Zufall war, dass sie korreliert sind. Leider ist es nicht möglich, erneut zu messen.
Das Problem, das mit dem sich stellt, ist: die Funktion, die durch die Algorithmen gewählt wird, eine Spaltung durchzuführen ist nicht die Funktion, die tatsächlich in der realen Welt zur Spaltung führt. Mit anderen Worten, das stark korrelierte Merkmal wird vom Algorithmus ausgewählt, während das andere Merkmal das zu wählende Merkmal ist. Deshalb möchte ich Regeln/Kausalitäten/Einschränkungen für den Baumlernprozess festlegen.
In meinem Fall die falsche Funktion der Wahl des Modells nicht beeinflusst, weil ich den Entscheidungsbaum verwenden möchten Kausalitäten innerhalb der Daten und die Merkmale zufällig sind sichtbar zu machen korreliert ... Was meinst du genau mit „eine kombinierte Klasse einführen“ ? Haben Sie ein konkretes Programm vor Augen, wo dies möglich ist? Danke – JanLob
@ JanLob: Wenn Sie Kausalitäten visualisieren wollen, wird C4.5 Ihnen das nicht geben. In der Tat, keine datenorientierte Methode kann Ihnen das geben. Sie arbeiten an Korrelation, nicht an Kausalität. Ich verstehe nicht, wie Sie hier sagen, dass Features "zufällig korreliert" sind, wenn die Frage das genaue Gegenteil "stark korreliert" sagt. Ich vermute, dass Sie Ihr Problem viel besser definieren müssen; Die Chancen stehen gut, dass Sie die Antwort nicht sehen, weil Sie die eigentliche Frage noch nicht haben. – MSalters
@ MSalters: Entschuldigung für die schlechte Formulierung! Ich meine nicht, dass Merkmale zufällig korreliert sind, aber zufällige Merkmale sind korreliert. Das heißt, wir haben nur eine kurze Zeitspanne, in der unsere Merkmale gemessen wurden, und in diesem Zeitraum haben wir eine Korrelation zwischen den Merkmalen.Aber wenn wir dieselben Merkmale erneut messen würden, würden wir wahrscheinlich keine Korrelation zwischen diesen Merkmalen bekommen, weil es nur ein Zufall war, dass sie korreliert sind. Deshalb möchte ich einige Regeln manuell festlegen (das Vorwissen). – JanLob