0

Die Frage bezieht sich auf this method, die Features aus der FC7-Schicht von AlexNet extrahiert.Welche Art von Features werden mit den AlexNet-Layern extrahiert?

Welche Art von Funktionen extrahiert es eigentlich?

Ich habe diese Methode auf Bilder von Gemälden von zwei Künstlern verwendet. Das Trainingssatz besteht aus ungefähr 150 Trainingsbildern von jedem Künstler (so dass die Merkmale in einer 300 × 4096-Matrix gespeichert sind); Der Validierungssatz besteht aus 40 Bildern. Das funktioniert wirklich gut, 85-90% korrekte Klassifizierung. Ich würde gerne wissen, warum es so gut funktioniert.

+0

Zunächst scheint das nicht korrekt. Dies ist eine Feedforward-Schicht mit 4096 Neuronen, daher legt Kx4096 nahe, dass Sie K Eingangsbilder weitergegeben haben. Doch weder Training (150) noch Test (40) stimmen nicht mit K = 300 überein, deshalb stimmt hier etwas nicht. – lejlot

+0

Sorry, 150 pro Künstler so 300 insgesamt. –

Antwort

1

WAS FUNKTIONIERT?

FC8 ist die Klassifikationsschicht; FC7 ist der vor ihm, wo alle vorherigen Kernel-Pixel linearisiert und verkettet sind. Diese repräsentieren die abstrakten Top-Level-Features, die das Modelltraining "entdeckt" hat. Um diese Funktionen zu untersuchen, probieren Sie eines der vielen Layer-Visualisierungstools aus, die online verfügbar sind (fragen Sie hier nicht nach Referenzen; SO verbietet Anfragen nach Ressourcen).

Die Merkmale variieren von Training zu Training, abhängig von der Kernel-Initialisierung (normalerweise zufällig) und sehr abhängig vom Trainingssatz. Allerdings sind die Merkmale in den frühen Schichten eher einfach, mit größerer Vielfalt und Detailliertheit in den späteren Schichten. Auf dem ursprünglichen AlexNet-Ziel (ILSVRC 2012, alias ImageNet-Datensatz) umfassen die FC7-Funktionen beispielsweise Fahrzeugreifen, Tiergesichter, verschiedene Arten von Blütenblättern, grüne Blätter und Stängel, zweibeinige Tier-Torsi, Flugzeugabschnitte, Autos/LKW/Bus Grill Arbeit usw.

Hilft das?

Warum funktioniert es so gut?

Das hängt von den Datensätzen und Trainingsparametern ab. Wie unterschiedlich sind die Bilder der Künstler? Es gibt viele Funktionen zum Extrahieren: Wahl des Motivs, Palette, Komplexität der Komposition, harte/weiche Kanten, gleichmäßige Ausrichtung der Pinselstriche. Zum Beispiel könnte die Unterscheidung von zwei frühen Kubisten ein wenig schwierig sein; Rembrandt von Jackson Pollack zu erzählen, sollte 100% erreichen.

Verwandte Themen