1

Ich muss Thema Modellierung in einer bestimmten Anzahl von Dokumenten in R mit LDA tun.Thema Modellierung mit bereits bestehenden Themen

Ich habe n am meisten vorkommende Wörter für jeden von M Themen und ich möchte dies LDA füttern und wollen die meisten vorkommenden Thema erhalten (aus M Themen), die in jedem Dokument.

Kurz -

Eingang - X Dokumente, M Themen mit n Top-Wörter für jeden

Output - Top 2 auftretenden Themen aus M Themen in jedem Dokument.

Gibt es eine Möglichkeit, dies mit bereits vorhandenen Paket in R oder einer anderen Sprache zu erreichen.

Antwort

0

Ja, dies ist mit MALLET möglich. Die Befehlszeilensyntax für diese Aufgabe lautet

wo die Klassifizierungsdatei Ihre vortrainierten Themen enthält.

+0

Was sollte der Inhalt der Klassifikationsdatei sein? Können Sie bitte ein Tutorial für die Klassifikator-basierte Themenmodellierung vorschlagen? – Shubham

+0

@Shubham: Versuchen Sie 'bin/mallet train-topics --help', das sollte Ihnen einen Überblick über die verschiedenen Ausgabedateien geben, die MALLET produzieren kann. – jknappen

Verwandte Themen