Ich bin neu zu Devnagaric NLP, gibt es irgendeine Gruppe oder Ressourcen, die mir helfen würde, mit NLP in Devnagaric Sprache zu beginnen (meist Nepali Sprache oder ähnlich wie Hindi). Ich möchte in der Lage sein, Schriften für Devanagaric zu entwickeln und auch einige Anwendungen zur Schriftbearbeitung zu verwenden. Wenn jemand (der in diesem Bereich arbeitet) mir Ratschläge geben könnte, wäre das sehr bemerkenswert. Vielen Dank im VorausDevanagaric Textverarbeitung (NLP) wo zu beginnen
Antwort
Gibt es eine Gruppe oder Ressourcen, die mir helfen würden, mit NLP in Devnagaric Sprache zu beginnen?
Die Bhasa Sanchar project unter Madan Puraskar Pustakalaya hat einen nepalesischen Korpus entwickelt. Sie können einen nepalesischen Korpus für nicht-kommerzielle Zwecke von dem Kontakt anfordern, der in dem obigen Link angegeben ist.
Python's NLTK hat den Hindi-Sprachkorpus. Sie können es importieren
from nltk.corpus import indian
Für Einblick mit gewinnen basiert NLP Devnagari, empfehle ich Ihnen Forschung durch papers.Nepali eine unterfinanzierte Sprache zu sein, viel Arbeit noch getan werden, und es könnte schwierig sein, zu erhalten Inhalte für das gleiche.
Sie sollten wahrscheinlich in die Spracherkennung, Textklassifizierung, Stimmungsanalyse unter anderem (vorzugsweise basierend auf POS-Tagging-Bibliothek aus dem Korpus) zum Erlernen der Grundlagen suchen.
Für den zweiten Teil der Frage
Ich bin ziemlich sicher, dass Schriftentwicklung nicht unter dem Bereich der Verarbeitung natürlicher Sprache kommt. Meinst du etwas anderes?
Ich bin neu in Devnagaric NLP, Gibt es eine Gruppe oder Ressourcen, die mich mit NLP in Devnagaric Sprache (meistens Nepali oder ähnlich wie Hindi) beginnen würde helfen
können Sie Einbettungen verwenden gegeben von fasttext [https://fasttext.cc/docs/en/pretrained-vectors.html#content] und verwenden Sie einige tiefere Lern-RNN-Modelle wie LSTM für Text-Klassifizierung, Sentiment-Analyse.
Sie können einige Datensätze für benannte Entität recoginition finden Sie hier [http://ltrc.iiit.ac.in/ner-ssea-08/index.cgi?topic=5]
Für indische Sprachen bearbeitet, können Sie hier finden [https://github.com/anoopkunchukuttan/indic_nlp_library]
NLTK unterstützt die indische lanugages, für pos Tagging und nlp Aufgaben im Zusammenhang möglich Siehe hier [http://www.nltk.org/_modules/nltk/corpus/reader/indian.html]
- 1. Hashtable/Map: wo zu beginnen
- 2. Wo beginnen Suchmaschinen zu crawlen?
- 3. Rede zu Textverarbeitung - Python
- 4. Wo mit Entity Framework zu beginnen
- 5. android eclipse jedisct1/libnatrium wo zu beginnen
- 6. Wie Textverarbeitung in Java zu tun
- 7. Haskell schnelle Textverarbeitung
- 8. Schnellere Textverarbeitung in BASH
- 9. Fragen zu Griffon beginnen?
- 10. Wo zu beginnen, implementieren lange Polling in Faye für iOS
- 11. Gibt es ein Nicht-Vision-Beispiel (wie Textverarbeitung) mit Caffe?
- 12. Wo auf einer Spracherkennung App beginnen
- 13. Wo kann ich mit der Audioverarbeitung beginnen?
- 14. Erkennen, wo Vocals in einem Song beginnen?
- 15. Python-Textverarbeitung: NLTK und Pandas
- 16. Regex vs readline für Textverarbeitung
- 17. Textverarbeitung (Zeilenumbruch) in Shell-Skript
- 18. NLP/Machine Learning Textvergleich
- 19. Stanford NLP Ausgabe Formatierung
- 20. Stanford NLP CoreNLP .NET
- 21. Stanford NLP RuntimeIOException
- 22. Wie verarbeitet man CIDR-Block/Textverarbeitung?
- 23. Kosten/Nutzen der multi-threaded Textverarbeitung
- 24. Verbesserung der Effizienz für diese Textverarbeitung Code
- 25. Filter in wählen, wo Werte beginnen mit NIR_
- 26. Wo Sie mit der Überwachung des Netzwerkverkehrs beginnen können
- 27. LINQ: ... Wo (x => x.Contains (Zeichenfolge, die mit "foo") beginnen)
- 28. Wo soll ich mit der Programmierung für Robotik beginnen?
- 29. Was ist der Unterschied zwischen Core NLP und Stanford NLP?
- 30. NLP von Gesetzestexten?