Gibt es irgendwelche Corpus kostenlos auf der Grundlage von News Artikeln und Schlagzeilen?Free Text Mining Corpora von Nachrichtenartikeln und Schlagzeilen
Ich suche nach Bereichen, in denen ich Text Mining und Analyse machen kann, für die ich ein Korpus von verwandten Daten brauche.
Wo kann ich sie frei herunterladen?
Frei, wie in "Freibier"? Wenn ja, ich glaube, du hast kein Glück. Und selbst wenn Sie oder Ihre Forschungsgruppe Teil des [LDC] (https://www.ldc.upenn.edu/) sind, gibt es auch nicht frei, wie in "frei lizensiert" (aber auf Kosten), AFAIK . Nachrichten sind aufgrund sehr restriktiver Lizenzbedingungen und Autorenrechte schwer zu verteilen. Sie sollten diese Daten wahrscheinlich am besten selbst abschaben, ehrlich gesagt ... Aber ich bin froh, dass ich mich als falsch erwiesen habe! – fnl
Okay. Entschuldigung für die Mehrdeutigkeit. Ich meinte eigentlich Open Source. ! –
Diese Art von Frage ist off-topic für SO. Es gibt jedoch mindestens einen Datensatz, der in den Sinn kommt: https://archive.ics.uci.edu/ml/datasets/reuters-21578+text+categorization+collection – emilliman5