Also Leute, ich bin ein Web-Parser machen es war gut, aber ich sah, dass einige Wörter innerhalb alles zusammen (und <strong>
im Körper zu). Mein Code ist This one here before nokogiri, aber ich bin neu in der Ruby-Programmierung und habe erst vor wenigen Stunden angefangen, über Nokogiri zu wissen.Entfernen <head> Probleme, ich brauche Anleitung/Hilfe
Ich wünschte, jemand könnte mir helfen, diese Arbeit zu machen. Ich muss .read die URL, entfernen und alles darin und scannen Wörter über den Rest der Seite
PS: Ist es möglich, nur den Körper zu bringen und es zu lesen? Es wäre einfacher PSS: Über <strong>
Tags, ist es schwer, es zu entfernen?
Meine Übung ist zählen, wie viele especific Wort auf der Seite sind, nicht Source-Code, das ist, warum ich muss nur den Körper packen und beseitigen: Tag
Wirklich hoffe jemand mir> helfen kann. < Thnks Leute!
Hier ist meine eigentliche Fehlercode/Die reine ursprüngliche here
require 'open-uri'
require 'cgi'
require 'nokogiri'
class Counter
def initialize(url)
@url = url
end
def decapitate
Nokogiri::HTML(url)
url.css('head').remove.to_s
end
def scan(word)
url.scan(word)
end
end
url, word = ARGV
puts "Found #{Counter.new(url).open.decapitate.scan(word).length} maches."
Mit '@ url' ist wahrscheinlich besser als url' zweimal auf zwei verschiedene Methoden in' vorbei. – tadman
@tadman: Oh ja, ich war wahrscheinlich nicht klar. Meine Lösung unten ist anstelle von OPs, kein Plug-in. Es ist einfach genug, um es anzupassen. Wenn es in die Klasse hineingehen würde, würde ich im Konstruktor packen, enthaupten und textifizieren, wobei "@ text" statt "@ url" gespeichert wird, so dass man mehrere Dinge auf demselben Dokument zählen kann ... – Amadan
Ah, das macht Sinn, eine eigenständige Methode. – tadman