1

Ich bin auf der Suche nach einigen Vorschlägen zu einem Problem, mit dem ich derzeit konfrontiert bin.Reduzierung der Dimension für SVM im Sensor-Netzwerk

Ich habe einen Satz von Sensor sagen S1-S100, die ausgelöst wird, wenn ein Ereignis E1-E20 durchgeführt wird. Nehmen wir an, normalerweise E1-Trigger S1-S20, E2-Trigger S15-S30, E3-Trigger S20-S50 usw. und E1-E20 sind völlig unabhängige Ereignisse. Gelegentlich kann ein Ereignis E einen anderen nicht verwandten Sensor auslösen.

Ich verwende ensemble von 20 svm, um jedes Ereignis separat zu analysieren. Meine Eigenschaften sind die Sensorfrequenz F1-F100, die Häufigkeit, mit der jeder Sensor ausgelöst wird, und einige andere ähnliche Merkmale.

Ich bin auf der Suche nach einer Technik, die die Dimensionalität der Sensor-Funktion (F1-F100)/oder einige Techniken, die alle Sensor umfasst reduziert und reduziert die Dimension zu (ich suchte nach einem Informationstheorie-Konzept für die letzte ein paar Tage) . Ich denke nicht, Mittelung, Maximierung ist eine gute Idee, da ich riskiere, Informationen zu verlieren (es gab mir kein gutes Ergebnis).

Kann mir bitte jemand vorschlagen, was fehlt mir hier? Ein Papier oder eine Anfangsidee ...

Vielen Dank im Voraus.

Antwort

2

Vielleicht möchten Sie vielleicht mit Linear Discriminant Analysis beginnen, es ist ein ziemlich einfacher Algorithmus und tut mehr oder weniger was Sie suchen: Dimensionalitätsreduktion und/oder Klassifikation. Es wird davon ausgegangen, dass jede Klasse mit verschiedenen Mitteln, aber derselben Kovarianz, Gauß-verteilt ist. Es ist wahrscheinlich eine gute Idee, einige der Daten vorher zu plotten, um sicherzustellen, dass diese Annahme vernünftig ist. Ich habe die LDA-Implementierung in R zuvor verwendet. Dies war jedoch mit etwa einem Dutzend Funktionen. Ich bin nicht sicher, wie es auf 100 Dimensionen skalieren würde.

Es kann auch hilfreich sein zu wissen, warum Sie die Dimension der Daten reduzieren möchten. SVMs werden häufig mit Hunderttausenden von (spärlichen) Funktionen verwendet. Was ist also die Schwierigkeit, die Sie haben?

+0

danke für die Antwort .. Ich werde versuchen, LDA .. ich will Dimension reduzieren, weil in den meisten Fällen, wenn E1 löst S1-S15, um den Wert für Rest der F16-F100 Sensorfrequenz sei Null, gelegentlich andere Sensor sagen S45, S50 kann auch einige Male ausgelöst werden ... hauptsächlich möchte ich alle diese Nullen aus dem Feature-Vektor – iinception

+0

Wort der Warnung auszuschließen, ist LDA auch Latent Dirichlet Allocation, eine verwandte, aber sehr unterschiedliche Algorithmus. – Stompchicken