2014-08-30 5 views
5

Ich bin neu in Rapid Miner 5, will nur wissen, wie Rauschen in meinen Daten zu finden und zeigen sie in Diagramm und wie Sie sie löschen?Wie erkennen und löschen Sie Rauschen in rapidminer?

+0

können Sie auch auf http://stats.stackexchange.com posten, um Ratschläge zur Rauschreduzierung (Ausreißererkennung?) Zu erhalten, unabhängig von der Technologie, die Sie verwenden werden. Mit anderen Worten, ich denke, dass Ihre Frage zwei verschiedene Fragen ist: eine über Prinzipien und die andere über Technologie. – fstab

Antwort

3

Ein komplexes Problem, denn es hängt davon ab, was Sie unter Rauschen verstehen.

Wenn Sie das Finden von einzelnen Attributen meinen, deren Werte einfach falsch sind, dann könnten Sie eine Histogrammansicht plotten und eine Art von Grenzen für einen gültigen Wert ausarbeiten. Sie könnten diese Regel dann mit Filter Examples erzwingen, um sie zu entfernen.

Wenn Sie das Finden von Attributen meinen, die irgendeine Art von zufälligem Jitter haben, wäre es schwierig, diese zu erkennen. Nur wenn man vorher weiß, was die erwartete Form der Verteilung ist, kann man mit der Beobachtung vergleichen und etwas dagegen tun. Die Vorgehensweise ist jedoch keineswegs offensichtlich.

Wenn Sie Beispiele in einem Beispielsatz suchen, die sich offensichtlich von anderen Beispielen unterscheiden, können Sie die verschiedenen Ausreißerfunktionen in Betracht ziehen. Der einfachste Einstieg ist Detect Outlier (Distances). Dies findet eine festgelegte Anzahl von Ausreißern (Standard 10) basierend auf einer Abstandsberechnung, die alle Attribute für Beispiele verwendet. Es erstellt ein neues Attribut namens outlier, das auf "True" oder "False" festgelegt ist. Sie könnten dann den Operator Filter Examples verwenden, um diejenigen zu entfernen, die auf true festgelegt sind.

Hoffe, dass hilft zumindest als Anfang.

Verwandte Themen