2017-11-27 1 views
0

Sagen wir, ich habe eine binäre Klassifizierung Aufgabe, und ich baue ein neuronales Netzwerk, um dies zu tun. Es gibt zwei verschiedene Rahmen zu wählen, in dem ersten ist das Netzwerk hat eine Ausgabe-Einheit, die die Wahrscheinlichkeit eines der Klasse, so kann ich die binäre Kreuz-Entropie, um den Verlust zu berechnen, die zweite ist das Netzwerk hat zwei Ausgabe-Einheiten, die die Wahrscheinlichkeiten, die zu den zwei Klassen gehören, getrennt angeben, kann ich auch die Softmax-Kreuz-Entropie verwenden, um den Verlust zu berechnen. Einige schlagen vor, die erste Option zu verwenden, meine Verwirrung ist, dass die Vor- und Nachteile der beiden Optionen sind, und was das schwerste Problem ist, wenn ich das zweite Rahmenwerk wähle? Kann mir das jemand im Detail erklären? Danke im Voraus.die Nummer der Ausgabeeinheit und die Verlustfunktion in binärer Klassifizierung Netzwerk

Antwort

0

Wenn Sie eine Ausgabeeinheit verwenden, sollten Sie verstehen, dass Sie streng zwischen zwei Klassen wählen. Wenn die Wahrscheinlichkeit hoch genug ist, wählt Ihr Netwrok Klasse A, andernfalls wählt er Klasse B. Wenn Sie zwei Ausgabeeinheiten haben, kann Ihr Netzwerk eine eher geringe Wahrscheinlichkeit für beide Einheiten erzeugen, so dass Sie weder A noch B haben Diese beiden Ansätze hängen davon ab, welches System Sie wirklich mit Ihrem Netzwerk modellieren möchten.

+0

Vielen Dank für Ihre Antwort @Alexey R. Ich verstehe nicht ganz Ihren Standpunkt. Selbst das Netzwerk hat zwei Ausgabeeinheiten, sagen wir y = [x1, x2], und ich kann die softmax-Funktion darauf anwenden, um die Wahrscheinlichkeiten zu erhalten, und was Sie meinen, dass Ihr Netzwerk eine ziemlich niedrige Wahrscheinlichkeit erzeugt, ist nicht immer wahr. Wenn die beiden Ausgänge sehr unterschiedlich sind, kann ich immer noch eine relativ hohe Wahrscheinlichkeit einer Klasse erreichen. – Schaffer

+0

Ja, aber wie würden Sie die Ergebnisse behandeln, wenn sie beide niedrig sind? In einem Netzwerk mit einer Ausgabeeinheit würde dies nicht der Fall sein. –

+0

In dieser Situation schlägt es vor, dass das Netzwerk die Klasse nicht sicher vorhersagen kann, was dem Netzwerk mit einer Ausgabeeinheit entspricht, wenn es ungefähr 0,5 ausgibt. – Schaffer

Verwandte Themen