Ich lerne neuronale Netzwerke und versuche, Lautsprecher-Erkennungssystem mit Tensorflow zu erstellen. Ich wollte wissen, wie die Länge der Äußerung das neuronale Netzwerk beeinflusst. Zum Beispiel habe ich 1000 verschiedene Tonaufnahmen mit den gleichen Längen und 1000 verschiedenen Tonaufnahmen mit unterschiedlichen Längen. Also, wie theoretisch funktioniert neuronales Netzwerk mit dieser Art von Daten? Wird neuronales Netzwerk mit Datenbank von gleichlangen Aufzeichnungen besser oder schlechter? Warum?Wie die Äußerungslänge das neuronale Netzwerk bei der Sprechererkennung beeinflusst?
5
A
Antwort
1
Es hängt von der Art des neuronalen Netzes ab. Wenn Sie so ein Design erstellen, geben Sie normalerweise die Anzahl der Eingabe-Neuronen an, sou kann sie nicht mit Daten beliebiger Länge versorgen. Bei längeren Sequenzen müssen Sie entweder Ihre Daten zuschneiden oder ein Schiebefenster verwenden.
Jedoch erlauben einige neurale Netze Ihnen, willkürliche Folge von Eingaben zu verarbeiten, wie z.B. Recurrent Neural Network. Letzteres scheint ein sehr guter Kandidat für Ihr Problem zu sein. Here ist ein guter Artikel, der die Implementierung von bestimmten RNN-Typen beschreibt, die Long Short-Term Memory genannt werden, die gut mit der Spracherkennung funktionieren.
1
Verwandte Themen
- 1. Wie organisiert man das wiederkehrende neuronale Netzwerk?
- 2. Künstliche neuronale Netzwerk-Rückpropagationstests
- 3. Warum sagt das neuronale Netzwerk nicht voraus?
- 4. Neuronale Netzwerk Approximationsfunktion
- 5. Neuronale Netzwerk-Bildarchitektur
- 6. Wiederkehrende neuronale Netzwerk-Klassifizierung
- 7. Neupy neuronale Netzwerk Probleme
- 8. neuronale netzwerk software
- 9. Wo finde ich die Übung über das konvolutionelle neuronale Netzwerk?
- 10. Neuronale Netzwerk Backpropagation Implementation Probleme
- 11. Wie ist das neuronale Netzwerk von Google zur Bilderkennung implementiert?
- 12. Wie bestimmen Architektur einer Faltung neuronale Netzwerk
- 13. Neuronale Netzwerk XOR Backpropagation benötigt
- 14. Neuronale Netzwerk-Tool in Matlab
- 15. Neuronale Netzwerk Klassifikator mit MLP
- 16. Neuronale Netzwerk-Backpropagation funktioniert nicht
- 17. 2-Dence neuronale Netzwerk-Genauigkeitsoptimierung
- 18. Skalierung der Eingangsdaten in das neuronale Netz
- 19. Auswählen von Zugbildern für das konvolutionelle neuronale Netzwerk
- 20. Neuronale Netzwerk basierte AI in 3D-Raum
- 21. Verallgemeinerte Form für neuronale Netzwerk-Backpropogation
- 22. Android Sprechererkennung
- 23. tensorflow Sprechererkennung
- 24. Beeinflusst das Culling die Animation
- 25. Wie beeinflusst @FunctionalInterface das Laufzeitverhalten der JVM?
- 26. Wie funktioniert das neue Bluetooth Mesh-Netzwerk bei der Bereitstellung?
- 27. Beeinflusst das Casting das Ergebnis der Operation?
- 28. Beeinflusst die Positionierung anderer Elemente bei Änderungen der Rahmenbreite nicht
- 29. Beeinflusst die Platzierung der Klammern die Lesbarkeit?
- 30. Roc-Kurve und Sprechererkennung