2017-03-01 3 views
1

Ich benutze Logstash-rss-Eingabe-Plugin, um RSS-Feeds in Elasticsearch Index, aber ich bekomme Text und HTML-Tag, die ich nur Text nicht HTML-Tag zu bekommen. kann mir jemand sagen, welches Filter-Plugin ich verwenden soll und wie man es filtert?Remove HTML-Tag von RSS-Eingabe logstash Plugin

Antwort

1

In Bezug auf Logstash was die xml plugin:

filter { 
    xml { 
    source => "my_source" 
    #other configs, see the doc 
    } 
} 
+0

Die XML-Filter wird mir den Artikel Text lassen extrahieren, aber es wird immer noch enthalten HTML-Markup – jamal

+0

was html_strip? – jamal

+0

Es hängt davon ab, ob Sie den RSS-Feed von logstash filtern oder die Filterung hauptsächlich auf die elastische Suche verschieben möchten. – Adonis

Verwandte Themen