WAS FUNKTIONIERT?
FC8 ist die Klassifikationsschicht; FC7 ist der vor ihm, wo alle vorherigen Kernel-Pixel linearisiert und verkettet sind. Diese repräsentieren die abstrakten Top-Level-Features, die das Modelltraining "entdeckt" hat. Um diese Funktionen zu untersuchen, probieren Sie eines der vielen Layer-Visualisierungstools aus, die online verfügbar sind (fragen Sie hier nicht nach Referenzen; SO verbietet Anfragen nach Ressourcen).
Die Merkmale variieren von Training zu Training, abhängig von der Kernel-Initialisierung (normalerweise zufällig) und sehr abhängig vom Trainingssatz. Allerdings sind die Merkmale in den frühen Schichten eher einfach, mit größerer Vielfalt und Detailliertheit in den späteren Schichten. Auf dem ursprünglichen AlexNet-Ziel (ILSVRC 2012, alias ImageNet-Datensatz) umfassen die FC7-Funktionen beispielsweise Fahrzeugreifen, Tiergesichter, verschiedene Arten von Blütenblättern, grüne Blätter und Stängel, zweibeinige Tier-Torsi, Flugzeugabschnitte, Autos/LKW/Bus Grill Arbeit usw.
Hilft das?
Warum funktioniert es so gut?
Das hängt von den Datensätzen und Trainingsparametern ab. Wie unterschiedlich sind die Bilder der Künstler? Es gibt viele Funktionen zum Extrahieren: Wahl des Motivs, Palette, Komplexität der Komposition, harte/weiche Kanten, gleichmäßige Ausrichtung der Pinselstriche. Zum Beispiel könnte die Unterscheidung von zwei frühen Kubisten ein wenig schwierig sein; Rembrandt von Jackson Pollack zu erzählen, sollte 100% erreichen.
Zunächst scheint das nicht korrekt. Dies ist eine Feedforward-Schicht mit 4096 Neuronen, daher legt Kx4096 nahe, dass Sie K Eingangsbilder weitergegeben haben. Doch weder Training (150) noch Test (40) stimmen nicht mit K = 300 überein, deshalb stimmt hier etwas nicht. – lejlot
Sorry, 150 pro Künstler so 300 insgesamt. –