Sagen wir, ich habe eine binäre Klassifizierung Aufgabe, und ich baue ein neuronales Netzwerk, um dies zu tun. Es gibt zwei verschiedene Rahmen zu wählen, in dem ersten ist das Netzwerk hat eine Ausgabe-Einheit, die die Wahrscheinlichkeit eines der Klasse, so kann ich die binäre Kreuz-Entropie, um den Verlust zu berechnen, die zweite ist das Netzwerk hat zwei Ausgabe-Einheiten, die die Wahrscheinlichkeiten, die zu den zwei Klassen gehören, getrennt angeben, kann ich auch die Softmax-Kreuz-Entropie verwenden, um den Verlust zu berechnen. Einige schlagen vor, die erste Option zu verwenden, meine Verwirrung ist, dass die Vor- und Nachteile der beiden Optionen sind, und was das schwerste Problem ist, wenn ich das zweite Rahmenwerk wähle? Kann mir das jemand im Detail erklären? Danke im Voraus.die Nummer der Ausgabeeinheit und die Verlustfunktion in binärer Klassifizierung Netzwerk
0
A
Antwort
0
Wenn Sie eine Ausgabeeinheit verwenden, sollten Sie verstehen, dass Sie streng zwischen zwei Klassen wählen. Wenn die Wahrscheinlichkeit hoch genug ist, wählt Ihr Netwrok Klasse A, andernfalls wählt er Klasse B. Wenn Sie zwei Ausgabeeinheiten haben, kann Ihr Netzwerk eine eher geringe Wahrscheinlichkeit für beide Einheiten erzeugen, so dass Sie weder A noch B haben Diese beiden Ansätze hängen davon ab, welches System Sie wirklich mit Ihrem Netzwerk modellieren möchten.
Verwandte Themen
- 1. Was ist die Verlustfunktion der Maske RCNN?
- 2. Verlustfunktion in LSTM neuronales Netzwerk
- 3. Neuronales Netzwerk mit mehreren Ausgängen, das Regression und Klassifizierung kombiniert
- 4. Wiederkehrende neuronale Netzwerk-Klassifizierung
- 5. binäre Klassifizierung mit spärlicher binärer Matrix
- 6. Berechnen Sie die Steigung der SVM Verlustfunktion
- 7. Feedforward-neurale Netzwerk-Klassifizierung in Matlab
- 8. Kann Caffe Only ohne Klassifizierung für die Klassifizierung verwendet werden?
- 9. Genauigkeit 99%, Klassifizierung falsch - Triplet-Netzwerk
- 10. Web-Client-Klassifizierung mit künstlichem neuralem Netzwerk
- 11. Kostensensitive Verlustfunktion in Tensorflow
- 12. Wie interagiert die Stapelverarbeitung mit der Verlustfunktion in TensorFlow?
- 13. Verschiedene Datensätze für die Klassifizierung und Zeitreihenanalyse?
- 14. Wird die SVM-Klassifizierung nur für die Klassifizierung von Datensätzen mit nur 2 Labels verwendet?
- 15. C# binärer Leser gibt falsche Nummer zurück?
- 16. Über binäre Klassifizierung in Caffe
- 17. Wie wird die Ausgabeeinheit von tf.layers.dense variabel gemacht?
- 18. Delphi 'Abhängigkeitsinformation der Ausgabeeinheit' - was macht es?
- 19. CS231n: Wie wird der Gradient für die Softmax-Verlustfunktion berechnet?
- 20. Unwucht Daten für die Klassifizierung
- 21. Was ist die Verlustfunktion, die den DNNRegressor verwendet?
- 22. Was macht Keras nach Definition der Verlustfunktion?
- 23. So speichern Sie die Variable in der Verlustfunktion in die Instanzvariable
- 24. Sollte Passwort-Hash in binärer oder hexadezimaler Nummer gespeichert werden?
- 25. Der Verlust der semantischen Segmentierung binärer Klassen mit nicht ausgeglichener Datenmenge konvergiert nicht
- 26. Convolutional Neuronales Netzwerk in Tensorflow für die Vorhersage
- 27. Keras/Tensorflow benutzerdefinierte Verlustfunktion
- 28. Die fehlende Nummer in der Sequenz finden
- 29. Javascript ändert die Nummer in der Zeichenkette
- 30. Generiere und wiederhole die Nummer in C#
Vielen Dank für Ihre Antwort @Alexey R. Ich verstehe nicht ganz Ihren Standpunkt. Selbst das Netzwerk hat zwei Ausgabeeinheiten, sagen wir y = [x1, x2], und ich kann die softmax-Funktion darauf anwenden, um die Wahrscheinlichkeiten zu erhalten, und was Sie meinen, dass Ihr Netzwerk eine ziemlich niedrige Wahrscheinlichkeit erzeugt, ist nicht immer wahr. Wenn die beiden Ausgänge sehr unterschiedlich sind, kann ich immer noch eine relativ hohe Wahrscheinlichkeit einer Klasse erreichen. – Schaffer
Ja, aber wie würden Sie die Ergebnisse behandeln, wenn sie beide niedrig sind? In einem Netzwerk mit einer Ausgabeeinheit würde dies nicht der Fall sein. –
In dieser Situation schlägt es vor, dass das Netzwerk die Klasse nicht sicher vorhersagen kann, was dem Netzwerk mit einer Ausgabeeinheit entspricht, wenn es ungefähr 0,5 ausgibt. – Schaffer