ich habe einen Text enthält Sätze in jeder Zeile, und vor jedem Wort seiner lemmetize Form exemple:Extract n Worte aus Zeichenfolge mit Perl
er „er“ ging „go“ auf „“ Schule „Schule "mit‚mit‘seinem‚seinem‘freinds‚freind‘
ich mochte zum Beispiel drei mal drei Wort extrahieren in in jeder Zeile. Das Ergebnis scheint wie folgt aus:
er „er“ ging „go“ auf „“ \ n
ging „go“ auf „“ Schule „Schule“ \ n
zu „bis“ Schule „Schule“ mit „mit“ \ n
Schule „Schule“ mit „mit“ seinem „seinem“ \ n
mit „mit“ seinem „seinem“ freinds „freind“ \ n
ich möchte, dies zu tun mit Perl.
Was Sie suchen, ist n-Gramm. Google "N-Gramm Perl" und Sie werden viele Möglichkeiten finden, dies zu tun, einschließlich Module auf CPAN. –
gehst du die Datei werfen. Für jede Zeile teilen Sie es durch das * Leerzeichen * Zeichen. 'for (int i = 0; i
Greg
Also, wo ist dein Code? Was hast du probiert? – melpomene