Ich möchte eine Merkmalsextraktion (oder ein Clustering) für ein Dataset mit Untermerkmalen durchführen. Zum Beispiel, Datensatz ist wie folgt. Ziel ist es, den Robotertyp anhand der Daten zu klassifizieren.Merkmalsextraktion für mehrere Untermerkmale
Samples : 100 robot samples [Robot 1, Robot 2, ..., Robot 100]
Classes : 2 types [Type A, Type B]
Variables : 6 parts, and 3 sub-features for each parts (total 18 variables)
[Part1_weight, Part1_size, Part1_strength, ..., Part6_size, Part6_strength, Part6_weight]
Ich möchte Merkmalsextraktion durchzuführen mit [Gewicht, Größe, Stärke] und extrahiert Verwendung Funktion als repräsentativer Wert für den Teil.
Kurz gesagt, mein Ziel ist es, das Feature auf 6 - [Part1_total, Part2_total, ..., Part6_total] zu reduzieren - und dann den Typ des Roboters mit diesen 6 Merkmalen zu klassifizieren. Also, kombiniere Feature mit "Gewicht", "Größe" und "Stärke" ist das Problem zu lösen.
Zuerst dachte ich über die Anwendung von PCA (Principal Component Analysis), weil es einer der beliebtesten Feature Extrahierungsalgorithmus ist. Aber es berücksichtigt alle 18 Merkmale separat, so dass "Part1_weight" als wichtiger angesehen werden kann als "Part2_weight". Aber was ich wissen muss, ist die Wichtigkeit von "Gewichten", "Größen" und "Stärken" unter den Proben, so dass PCA nicht anwendbar ist.
Gibt es eine Möglichkeit, dieses Problem zu lösen?
Vielen Dank für Ihren Rat. Es ist jedoch leicht, PCA getrennt durchzuführen (dh PCA zu Part1_size, Part1_strength, Part1_weight zum Extrahieren von Feature für Part1, PCA zu Part2_size, Part2_strength ... für Part2 usw.), aber es scheint schwierig zu sein, allgemeine PCA zu berechnen jedes Untermerkmal (dh PCA zu gemeinsamer Parts_size, Parts_strength, Parts_weight für die Merkmalsextraktion für jedes Teil). Hast du eine Ahnung davon? – z991
Ich verstehe den zweiten (schwierigen) Teil der Frage nicht. Versuchen Sie, die Größe, das Gewicht und die Stärke in einem Merkmal zu kombinieren? In diesem Fall müssen Sie sie normalisieren, da sie in verschiedenen Einheiten und auf unterschiedlichen Skalen gemessen werden. –
Sorry, ich war ein wenig verwirrt, aber jetzt habe ich verstanden. Vielen Dank für Ihre Antwort. – z991