2016-06-01 4 views
1

Ich benutze Röntgenstrahlen, um einige Daten von einer Website zu extrahieren, aber wenn ich an den Punkt zu crawlen zu einer anderen Seite mit der integrierten Funktionalität kommt, funktioniert es einfach nicht.Kratzen Web mit Röntgen

Einzelpreis ist der Parameter I extrahiert werden soll, aber ich "undefined" die ganze Zeit.

Wie Sie sehen können, gebe ich den href-Wert, der zuvor auf der URL-Eigenschaft extrahiert wurde.

var Xray = require('x-ray'); 
var x = Xray(); 
var x = Xray({ 
    filters: { 
    cleanPrice: function (value) { 
     return typeof value === 'string' ? value.replace(/\r|\t|\n|€/g, "").trim() : value 
    }, 
    whiteSpaces: function (value) { 
     return typeof value === 'string' ? value.replace(/ +/g, ' ').trim() : value 
    } 
    } 
}); 

x('https://www.simply.es/compra-online/aceite-vinagre-y-sal.html', 
    '#content > ul', 
    [{ 
    name: '.descripcionProducto | whiteSpaces', 
    categoryId: 'input[name="idCategoria"]@value', 
    productId: 'input[name="idProducto"]@value', 
    url: 'li [email protected]', 
    price: 'span | cleanPrice', 
    image: '[email protected]', 
    unitPrice: x('li [email protected]', '.precioKilo') 
    }]) 
    .paginate('[email protected]') 
    .limit(1) 
    // .delay(500, 1000) 
    // .throttle(2, 1000) 
    .write('results.json') 
+0

Ich kann nicht verstehen, warum diese Bibliothek so viele Sterne bekam, wenn es so gut wie keine Tutorials im Internet ist und die Dokumentation ist wirklich schlecht. – naneri

+0

Ich denke, die Dokumente sind nicht auf dem neuesten Stand, aber die Bibliothek hat noch Potenzial – Rober

Antwort

Verwandte Themen