var http = require('http');
var urlOpts = {host: 'www.nodejs.org', path: '/', port: '80'};
http.get(urlOpts, function (response) {
response.on('data', function (chunk) {
var str=chunk.toString();
var re = new RegExp("(<\s*title[^>]*>(.+?)<\s*/\s*title)\>", "g")
console.log(str.match(re));
});
});
AusgabeAbrufen des Seitentitels von einer geschabt Webseite
[email protected] ~ $ node app.js [ 'node.js' ] null null
Ich muß nur den Titel bekommen.
@argonius hat einen guten Punkt in seinem Beispiel, dass Sie vermutlich zusätzlich zu 'g' auch das 'i'-Flag verwenden sollten, damit der reguläre Ausdruck die Groß-/Kleinschreibung nicht beachtet (da das Gehäuse des'
funktioniert nicht mit SPA-Webseiten, wenn der Titel mit JavaScript festgelegt wurde. Sie sollten Headless Browser wie Google Chrome verwenden –