Ich schreibe eine Rechtschreibwort-Anwendung für meinen Sohn und möchte Empfehlungen für gute APIs, die verstanden werden können, wenn es spricht. Ich programmiere in .Net also etwas, das mit dem interpolieren würde, wäre praktisch. Danke im Voraus.Gute Freitext-to-Speech-API für Rechtschreibwort Tutor
Antwort
MS Speech SDK. Es wird über eine .NET-Assembly verfügbar gemacht. Sehr einfach zu bedienen. Meine Kinder waren begeistert. Frei.
using System.Speech.Synthesis;
public class SpeakHelloWorld
{
public static void Main(string[] args)
{
SpeechSynthesizer synthesizer = new SpeechSynthesizer();
synthesizer.Speak("As for me and my house, ...");
}
}
Die vom obigen Code erzeugten Sounds verwenden keine natürliche Flexion mit Pausen und so weiter. Mit einem vollständigen Satz klingt es nicht menschlich. Aber einzelne Wörter klingen ok, nur irgendwie Roboter.
Für ein kleines Kind, mit einer kleinen Menge von Wörtern, möchten Sie vielleicht nur Ihre eigene Stimme aufnehmen, die Worte sagen. Ich tat das mit einem USA-Staatsrätsel, um die Staatsnamen auszusprechen, anstatt auf den Synthesizer zurückzugreifen.
Sie wissen nicht, warum ich nicht daran denken war vor-
ich ein Wörterbuch-Lookup-Tool zu tun, und wollte die Aussprache, um es hinzuzufügen. Anstatt Text-to-Speech zu verwenden, was einen robotischen Sound ergibt, habe ich einen anderen Ansatz gewählt. M-W.com hat menschliche Stimmen in. Wav-Dateien für die meisten Wörter erfasst. Also scrape ich die Merriam-Webster-Website, um eine WAV-Datei für das Wort zu erhalten, und spiele dann , die ist. Wenn Ihre App verbunden wird, könnte das auch für Sie funktionieren.
Dies ist der Fluss geht es durch:
pronouncing Tricky...looking up 'Tricky'...
dictionary page: http://www.merriam-webster.com/dictionary/Tricky
got dictionary page markup, 35828 chars...
getting pronunciation uri...
got uri: 'http://www.merriam-webster.com//cgi-bin/audio.pl?tricky01.wav=tricky'...
getting page markup...
got pronunciation page markup, 3498 chars...
getting wav uri...
got wav uri: 'http://media.merriam-webster.com/soundc11/t/tricky01.wav'...
getting wav data...
got wav data, 6260 bytes...
playing wav data.
done.
some prototype source code that does it hier.
Dies funktioniert auf dem .NET Framework 2.0 und funktioniert auch auf dem .NET CF 2.0. Es ist nur eine Illustration. Es ist naiv, die richtige .wav-Datei auszuwählen, wenn mehrere Wortformen und mehrere Aussprachen vorhanden sind. Wenn Sie nach einem Plural fragen, erhalten Sie es möglicherweise nicht. Vielleicht möchten Sie auch Caching und zusätzliche Ausnahmebehandlung hinzufügen, um es zu verhärten.
Ich würde gerne den Code dafür sehen. Das ist eine wirklich coole Idee! –
ok Ich habe den Beitrag aktualisiert und den Code hinzugefügt. – Cheeso
- 1. Calculate Gehalt von Tutor basierend auf verschiedenen Sitzungen mit mysql
- 2. Beispiele für gute Systemtestberichte?
- 3. Gute Ressourcen für Versionierung
- 4. Gute Alternative für ASpell?
- 5. Gute Flexionsbibliothek für PHP?
- 6. Namenskonventionen für gute Namensräume
- 7. Gute Rechtschreibprüfung für Quellcode?
- 8. Gute Websites für Hintergrundmuster
- 9. Gute Ressourcen für Wordpress?
- 10. Gute lineare Programmierbibliothek für C#?
- 11. Gute Plot-Bibliothek für C?
- 12. Gute Beispiele für MVVM Template
- 13. Gute Hash-Funktion für Permutationen?
- 14. Gute IDEs für Windows Scripting
- 15. Gute referenz für win32 API
- 16. Gute Praktiken für Capistrano Konfigurationsmanagement?
- 17. Gute Seite für Projekt-Feedback?
- 18. Gute Anleitung für VIM Scripting?
- 19. Gute Beispielanwendung für Android-Dienst
- 20. Gute Anleitung für Linux-Interna?
- 21. Gute Namenskonvention für anonyme Typen
- 22. Gute Ressource für gespeicherte Prozeduren
- 23. gute Referenz für x86 Montageanleitung
- 24. gute Bibliothek für Datumsbereiche & Zeiten
- 25. Vorschläge für eine gute Inhaltsformatierungsbibliothek
- 26. OpenMP: gute Strategien für Tiefensuche
- 27. Gute C IDE für Mac?
- 28. Eine gute Referenz für JQOM?
- 29. gute Praxis für Code-Flow?
- 30. gute 3D-Bibliotheken für Flash
War es klar genug, um eine Anwendung für ein Rechtschreibwort zu machen, oder hat es die Wörter falsch ausgesprochen. –
Es ist ziemlich gut. Es klingt immer noch wie eine Computerstimme, aber ziemlich gut. Es ist sehr einfach, es auszuprobieren, so dass Sie in nur wenigen Minuten für sich selbst sehen können. – Cheeso