Ich habe eine Reihe von 240 Funktionen mit Bildverarbeitung extrahiert. Ziel ist es, Testfälle nach dem Training in 7 Klassen einzuteilen. Für jede Klasse gibt es ungefähr 60 Beobachtungen (nämlich, ich habe ungefähr 60 Merkmalsvektoren für jede Klasse, wobei jeder Vektor 240 Komponenten hat).Verwendung von Bhattacharyya Entfernung für Feature-Auswahl
Viele Forschungsarbeiten und Bücher nutzen die Sequential Forward Search oder Sequential Backward Suche nach Auswahl der besten Features aus einem Feature-Vektor. Das folgende Bild zeigt einen sequenziellen Vorwärtssuchalgorithmus.
Jeder solcher Algorithmus verwendet ein Kriterium, um zwischen Merkmalen zu unterscheiden. Eine gängige Methode ist, die Bhattacharyya-Distanz als Kriterium zu verwenden. Die Bhattacharyya-Distanz ist ein Divergenztyp zwischen den Verteilungen. Bei einigen Untersuchungen und Studien fand ich, dass eine Matrix M1 für eine Klasse A, die aus allen 60 Merkmalsvektoren dieser Klasse besteht, so gegeben ist, dass sie n = 60 Zeilen und m = 240 Spalten (da es insgesamt 240 Merkmale gibt) und Eine ähnliche Matrix M2 für eine Klasse BI kann die Bhattacharyya Distanz zwischen ihnen herausfinden und ihre gegenseitige Abhängigkeit finden.
Meine Frage ist, wie integriere ich die beiden. Wie schließe ich die Bhattacharyya-Distanz als Kriterium für die Auswahl der besten Merkmale im oben beschriebenen Algorithmus ein?
Gibt es einen Code für 'OperateBhattacharrya' Funktion? – Matthieu
@Matthieu wäre es gewesen. Dies war ein Forschungsprojekt vor zwei Jahren. – Sohaib