1
Gibt es eine Möglichkeit, bereits verarbeiteten Datensatz für nur englischen Text mit Python zu filtern? Vielleicht ein paar NLTK-Features oder so ähnlich. Die Daten wurden von Twitter extrahiert, und es ist Format ist folgendes:Twitter-Dataset-Filter für nur englischen Text mit Python
<tweetid>, <username>, <userid> &8888 <tweet text>
Stream-Filterung nicht geeignet ist, da ich die Anfangsdaten nur im Format oben zeigte. Jede Hilfe wird geschätzt, danke.
Danke, das ist sehr hilfreich. – mjackie