2017-05-29 1 views
1

Ich bin neu bei Python und komme aus dem Java-Hintergrund.Wie installiert man nltk_data als Paket mit Pip?

Ich habe ein Projekt, das nltk und nltk_data verwendet. Ich heruntergeladen nltk_data mit nltk.download() auf meinem Laptop und das Projekt funktioniert gut, aber ich möchte das Herunterladen von nltk_data automatisieren.

Ich kann es von der Befehlszeile herunterladen, aber ich möchte es träge als pip downloads Paket auf pip install. Also meine Fragen sind:

  • Kann ich installieren nltk_data als reguläres Python-Paket mit pip?
  • Was ist der beste Weg, um nltk_data faul herunterzuladen?
+0

Es ist nicht möglich, mit pip weil 'nltk_data' ist keine Python-Bibliothek, sondern nur ein Repository von Dateien. Verwende 'python -m nltk.downloader all'. – alvas

+0

Danke. Es stellte sich heraus, dass ich nur eine Teilmenge von all diesen "nltk_data" brauche. Was ist der beste Weg, diese Teilmenge als meine Projektabhängigkeit zu "packen", um mein Programm zu verteilen? – Michael

+0

Welcher Datensatz benötigen Sie? – alvas

Antwort

1

Der Boden des NLTK data documentation erklärt dies:

Führen Sie den Befehl python -m nltk.downloader all. Führen Sie den Befehl sudo python -m nltk.downloader -d /usr/local/share/nltk_data all aus, um eine zentrale Installation zu gewährleisten.

Wenn Sie Ihr Programm verteilen möchten, könnten Sie eine setuptoolssetup.py Datei zu prüfen, schreiben die Installation zu vereinfachen:

What is setup.py?

Official packaging docs

Verwandte Themen