Ich muss alle Textzonen einer Zeitung automatisch erkennen, die auf Kanten basieren (neue Ideen sind willkommen).Artikelzone der Zeitung erkennen (Textblock)
Das Ergebnis, das ich brauche, ist viele TXT-Datei, die jeweils einen Artikel enthält. Werfen Sie einen Blick auf diese Demonstration.
Ich gehe davon aus, dass Sie etwas zu diesem Thema recherchiert haben, bevor Sie hierher gekommen sind und etwas ausprobiert haben, oder? Was hast du versucht und was war das Ergebnis? –
Ja Ja Mann Ich fand nichts, was mir half, das Ergebnis zu erreichen ... alles was ich fand war für C#: '( alles was ich brauche ist, dass meine Anwendung erkennt, dass es 5 Artikel in dieser Seite gibt und Unterschiede zwischen sie ... nach dem Titel und dem Inhalt Text, um sie in TXT-Datei zu speichern. – Algerowalid
Die Implementierung Sprache ist irrelevant: Dies ist ein Algorithmus-Problem, das in jeder Sprache behandelt werden könnte.Es gibt Papiere, die dies abdecken, würde ich vorschlagen entweder im Internet suchen oder eine Mitgliedschaft für etwas wie die digitale Bibliothek des ACM bekommen - die meisten Zeitungen dort sind kostenlos verfügbar, aber sie sind viel einfacher im ACM DL zu finden. –