Ich habe eine Volltextsuche in einer Diskussionsforum-Datenbank implementiert und ich möchte die Suchergebnisse in einer Weise anzeigen, wie Google tut. Selbst für eine sehr lange HTML-Seite werden nur zwei oder drei Zeilen der Texte in einer Suchergebnisliste angezeigt. Normalerweise sind dies die Zeilen , die einen Suchbegriff enthalten.Extrahieren Sie kleine relevante Bits Text (wie Google tut) aus den Volltextsuchergebnissen
Was wäre der gute Algorithmus, wie man einige Zeilen des Textes basierend auf dem Text selbst und einem Suchbegriff extrahiert. Ich könnte mir etwas vorstellen, das so einfach ist, wie nur eine Textzeile vor dem Suchbegriff in einem Text und einer Zeile danach zu verwenden - aber das scheint zu einfach zu funktionieren.
Möchten Sie ein paar Richtungen, Ideen und Einblicke erhalten.
Vielen Dank.
Natural Language Processing-Tag (nlp) hinzugefügt –