Ich arbeite an etwas Code, der eine Seite für zwei CSS-Klassen auf einer Seite scrapt. Ich bin einfach die Hpricot Suchmethode für diese Verwendung als so:Hpricot CSS Klassensuche
webpage.search("body").search("div.first_class | div.second_class")
... für jedes Element finde ich ein Objekt erstellen und es in ein Array setzen, das funktioniert toll, bis auf eine Sache.
Die Suche wird durch die gesamte HTML-Seite gehen und jedes Mal ein Objekt in ein Array einfügen, wenn sie auf ".first_class" stößt. Dann wird das Dokument erneut durchsucht und nach ".second_class" gesucht enthält alle gesuchten Objekte in der falschen Reihenfolge im Array, dh alle '.first_class'-Objekte, gefolgt von allen' .second_class'-Objekten.
Gibt es eine Möglichkeit, dass ich das Dokument in einem Schritt durchsuchen und ein Objekt in das Array jedes Mal hinzufügen kann, wenn es eine der angegebenen Klassen trifft, gibt mir ein Array von Elementen in der Reihenfolge sie sind rüberkommen auf der Seite, die ich schabe?
Jede Hilfe sehr geschätzt. Dank