2016-05-18 3 views
0

Ich habe nach einer Lösung/Bibliothek oder irgendeiner Funktion gesucht, die die Textkategorisierung eines einzelnen Absatzes ohne jegliches Training in R durchführt. Ich muss Contact Center-Anrufdaten einzeln kategorisieren/klassifizieren. Die Anrufe müssen nach den vom Agenten oder Anrufer verwendeten Begriffen kategorisiert werden. Die Begriffe dürfen nicht fortlaufend sein und folgen daher nicht dem Bigramm.Textkategorisierung In R für einzelnen Absatz

Zum Beispiel die folgende Beispieltext sollte so etwas wie „Router Internet issues“

„Hallo danke Lösungen für den Aufruf von XYZ kategorisiert werden. Dies ist Mark. Wie kann ich Ihnen helfen? Hallo, ich habe seit Probleme bei der Verbindung mit dem Internet Probleme scheint mit meinem Router. "

Ich habe versucht, OpenNLP, RTextTools-Bibliotheken in R, aber konnte nicht herausfinden, wie ein einzelner Absatz zu verarbeiten. Hat jemand irgendwelche Ideen? Jede Hilfe wird geschätzt.

Herausgegeben Als ich ein Anfänger in R bin so würde schätzen viel eine gründliche Lösung, wenn möglich

+1

Das sieht wie eine sehr breite Frage aus. Was hast du versucht? Fügen Sie die Codezeilen einschließlich Beispieldaten hinzu - bereit zum Kopieren-Einfügen-Ausführen in R für die Reproduktion. – lukeA

+0

Können Sie einen Vektor mit allen eindeutigen Kategorien erstellen? – Sotos

+0

Auf der anderen Seite können Sie einen Vektor mit Schlüsselwörtern erstellen und diesen Vektor verwenden, um diese Schlüsselwörter (falls vorhanden) aus jedem Absatz zu extrahieren – Sotos

Antwort