Rails, eine HTML-Zeichenfolge von einem WYSIWYG gegeben - wie man nur Text

Ich habe eine große HTML-Zeichenfolge aus einem WYSIWYG und möchte eine Zeichenfolge abgeschnitten nur Text, keine HTML-oder HTML-Tags. Gibt es eine Möglichkeit, dies in Schienen eingebaut oder brauche ich ein Gsub, um alle HTML-Klammern loszuwerden?Rails, eine HTML-Zeichenfolge von einem WYSIWYG gegeben - wie man nur Text

Dank

Quelle

2010-11-26 AnApprentice

Schienen enthält bereits einige leistungsstarke sanitization helpers.

string = '<span id="span_is"><br><br><u><i>Hi</i></u></span>' 
strip_tags(string)

Quelle

2010-11-27 12:46:07 Salil

Das ist ziemlich gut, aber es lässt viel " " – AnApprentice

Es hängt davon ab, wie komplex Ihre HTML, aber Sie sicherlich Nokogiri und XPath den Text zur Abfrage verwenden könnte, die Sie aus dem HTML wollen. Es hängt davon ab, wie viel Sie analysieren möchten, und ob es eine zusätzliche Bibliothek rechtfertigt, um dies zu tun.

Quelle

2010-11-26 22:58:08 Scott

Ein Parser kann es tun, aber wäre übertrieben, wenn Sie einfach HTML zu präsentieren haben. Etwas wie Loofah oder sanitize könnte alle Tags mit Nokogiri entfernen, um den HTML-Code zu analysieren und dann die Tags zu entfernen, so dass Sie den Text erhalten.

require 'sanitize' 

html = '<html><body>Jackdaws love my giant sphinx of quartz.</body></html>' 
puts Sanitize.clean(html) 
# >> Jackdaws love my giant sphinx of quartz.

Ich denke, Luffa fähiger als sanieren, aber wenn alles, was Sie tun möchten, ist Tags wegwerfen sanieren könnte der Weg zu gehen.

Quelle

2010-11-26 23:00:09

Rails, eine HTML-Zeichenfolge von einem WYSIWYG gegeben - wie man nur Text

Antwort

Verwandte Themen