Der folgende unstrukturierte Text hat drei unterschiedliche Themen - Stallone, Philadelphia und die Amerikanische Revolution. Aber mit welchem Algorithmus oder welcher Technik würden Sie diesen Inhalt in einzelne Absätze unterteilen?Wie verwende ich NLP, um einen unstrukturierten Textinhalt in einzelne Absätze zu trennen?
Klassifizierer funktionieren in dieser Situation nicht. Ich versuchte auch, Jaccard Similarity Analyzer zu verwenden, um Abstand zwischen aufeinander folgenden Sätzen zu finden, und versuchte, aufeinanderfolgende Sätze in einen Absatz zu gruppieren, wenn der Abstand zwischen ihnen weniger als ein gegebener Wert war. Gibt es eine bessere Methode?
Das ist mein Text Beispiel:
Sylvester Stallone Gardenzio, der den Spitznamen Sly Stallone, ist ein amerikanischer Schauspieler, Regisseur und Drehbuchautor. Stallone ist bekannt für seine Machismo- und Hollywood-Action-Rollen. Stallones Film Rocky wurde in das National Film Registry aufgenommen und seine Filmrequisiten wurden im Smithsonian Museum platziert. Stallone nutzte den Eingang zum Philadelphia Museum of Art in der Rocky-Serie und ließ die Gegend als Rocky Steps bekannt werden. Philadelphia war einst die zweitgrößte Stadt im britischen Empire (nach London), ein Handels-, Bildungs- und Kulturzentrum), und das soziale und geografische Zentrum der ursprünglichen 13 amerikanischen Kolonien. Es war ein Herzstück der frühen amerikanischen Geschichte, Gastgeber für viele der Ideen und Aktionen, die die amerikanische Revolution und Unabhängigkeit geboren. Die amerikanische Revolution war der politische Umsturz in der letzten Hälfte des 18. Jahrhunderts, in dem dreizehn Kolonien in Nordamerika beigetreten zusammen, um aus dem Britischen Empire auszubrechen und sich zu den Vereinigten Staaten von Amerika zu vereinigen. Sie lehnten zuerst die Autorität des Parlaments von Großbritannien ab, um sie von Übersee ohne Vertretung zu regieren, und vertrieben dann alle königlichen Beamten. Bis 1774 hatte jede Kolonie einen Provinzialkongress oder eine gleichwertige Regierungsinstitution gegründet, um einzelne selbstverwaltete Staaten zu bilden.