2017-09-25 4 views
0

Anfänger RapidMiner Frage hier. Sagen wir, ich bin fertig mit der Entwicklung eines prädiktiven kNN-Modells durch z.B. Kreuzvalidierung und ich möchte jetzt mit diesem Modell Vorhersagen über den gesamten Datensatz machen, an dem ich gearbeitet habe (Zug und Testset), wie wird das gemacht? Ich habe versucht, die folgenden:Anwenden von kNN-Modell auf den gesamten Datensatz in RapidMiner

enter image description here

aber dann jedes ‚label‘ des Objekts wird in einem eigenen Nähe Umgebung enthalten, so, wenn k = 1 der Vorhersagefehler = 0, was sollte natürlich nicht passieren.

Antwort

0

Sie sind richtig, das Modell auf den gleichen Daten anwendend, auf denen es trainiert wurde, ist falsch. Normalerweise würde jemand einen Test durchführen, bei dem Sie einen Teil der Daten für das Training des Modells und dann einen anderen Teil (der nicht am Training beteiligt war) zum Testen verwenden.

Denken Sie daran, dass eine Kreuzvalidierung normalerweise nicht Teil des Trainings ist, sondern eine Methode, um sicherzustellen, dass Ihr Modell stabil und nicht übertrainiert auf den präsentierten Daten ist.

Ich kann empfehlen, einen Blick auf die RapidMiner Tutorial Videos auf applying, testing und validating zu werfen.

Fühlen Sie sich auch frei, weitere Fragen zu stellen, oder Fragen erneut in der RapidMiner community forum.

1

Ok es kann durch Extraktion des ‚Test-Sets‘ erfolgen von innen ‚Kreuzvalidierung‘ siehe unten:

enter image description here

Also im Grunde die gesamte Datenmenge der Test- und Trainingssatz ist, wenn Kreuzvalidierung verwendet wird und Vorhersagen sind auch in der Ausgabe als zusätzliche Spalte enthalten, nicht sicher, ob es sich um Durchschnittswerte oder nur um die letzte Iteration handelt.

+0

Ah, tut mir leid, wenn ich Ihre Frage falsch verstehe. Übrigens ist es sehr praktisch, die XML-Dateien Ihrer RapidMiner-Prozesse zu teilen. – David

+0

Keine probs danke für die Mühe zu beantworten. Es ist ein kniffliges Problem, da kNN ein Spezialfall ist, wenn es um Training/Testen geht. Hier gibt es eine interessante Diskussion: https://stackoverflow.com/questions/10814731/knn-training-testing-and-validation – Johan

Verwandte Themen