Ich arbeite an der Erkennung der Webseitensprache und es ist mir gelungen, den Inhalt einer Seite durch andere von mir entwickelte Middleware zu erhalten. da es keine Standardisierung des Inhaltsortes gibt. Wie auch immer, ich weiß nicht, wie ich die Sprache erkennen kann, die ich versucht habe, lang und xml: lang tag zu verwenden, aber sie sind nicht so effizient, wie ich es erwartet habe, weil ich gesehen habe, dass irgendeine Webseite eine andere Sprache als die im Tag angegebene hat Hilfe wird geschätzt? (environment java eclipse)Webseite Spracherkennung basierend auf dem Inhalt
2
A
Antwort
1
Dies ist ein klassisches Problem in NLP, und gibt ziemlich gute Vorhersagen. Dieser Beitrag sieht ähnlich aus wie dieser: link und habe da einige gute Antworten. Ich bin nicht vertraut mit den dort genannten Lösungen, aber ich habe den Apache Tika für eine andere Sache verwendet und es ist eine große Open Source. Hoffe, dass hilft ..
Verwandte Themen
- 1. Spracherkennung auf dem iPhone
- 2. Webseite Inhalt nach dem Refresh Server Seite
- 3. Webseite nach dem Senden von Inhalt umleiten
- 4. Edit CSS auf einem div basierend auf dem Inhalt in
- 5. Redirect auf neue Webseite basierend auf Entscheidungen
- 6. Textgröße ändernFeld basierend auf Inhalt
- 7. SQL eine neue Spalte erstellen basierend auf dem Inhalt
- 8. Bedingte innere Verknüpfung basierend auf dem Inhalt der primären Tabelle
- 9. Filtern einer Liste von Strings basierend auf dem Inhalt
- 10. Filtern der in OpenFileDialog angezeigten Dateien basierend auf dem Inhalt?
- 11. Passen NSTextField Inhalt Größe basierend auf dem String-Wert
- 12. jQuery-Selektor: Tabellenzelle basierend auf dem Inhalt finden
- 13. Bootstrap Dropdown basierend auf dem Inhalt der MySQL-Tabelle
- 14. WPF: Berechnung der Fenstergröße basierend auf dem Inhalt
- 15. Sortieren Bilder basierend auf Inhalt
- 16. CSS-Regel basierend auf Inhalt
- 17. Delivering Inhalt basierend auf wählt
- 18. Inhalt basierend auf Rollen anzeigen
- 19. Erkenne Textrichtung basierend auf Inhalt
- 20. Datei Split basierend auf Inhalt
- 21. Inhalt der Webseite zentrieren
- 22. Inhalt der Webseite speichern (php)
- 23. IOS-Abschnitt Fußzeilenhöhe basierend auf Inhalt
- 24. .htaccess Redirect auf bestimmte Webseite basierend auf Browser
- 25. wenn sonst Aussage - basierend auf iFrame Inhalt?
- 26. Polymer-Display-Inhalt basierend auf URL
- 27. Sizing SmartGWT Window basierend auf Inhalt
- 28. ASP.NET render Inhalt basierend auf dem Inhalt der ActionResult-Methode anzeigen
- 29. WPF ändern Zelle Hintergrundfarbe basierend auf Inhalt
- 30. Listeneintrag ändern Hintergrund basierend auf Inhalt/Variable
Ich arbeite an Java und ich überprüfe bereits den Link, aber die Bibliothek, die sie verwiesen (speziell Sprachdetektor) hat ein Problem der Genauigkeit gibt es unterschiedliche Ergebnisse für den gleichen Text und unterstützt begrenzte Sprache –