2016-04-23 12 views
0

Das mag wie eine dumme Frage erscheinen, aber ist es möglich, nur einen Teil einer Webseite (wie in, der Server senden nur eine bestimmte <div>) abrufen? Ich weiß, dass es möglich ist, nur get the HEAD of a page via HTTP (at least in Python).Nur bestimmte Teile einer Webseite für geringere Netzwerknutzung abrufen?

Ich denke, es ist in direkter Verletzung der Art, wie HTTP GET funktioniert, aber ich entschied mich trotzdem zu fragen.

Ich denke über webscraping Tausende von Seiten, und ich bemerkte, dass die Datennutzung ziemlich hoch wird. Ich brauche nicht die ganze Seite, nur den relevanten Teil.

Antwort

2

Es hängt davon ab, was Sie mit "bestimmten Teil der Seite" meinen.

Das HTTP-Protokoll erlaubt es, einen Teil des Inhalts unter Verwendung der Startposition und der Antwortgröße anzufordern, siehe Range Header wie in other SO question Retreive part of web page beschrieben.

Wenn Sie etwas wie "nur die Tabelle auf der Seite" möchten, haben Sie kein Glück, da es keine Möglichkeit gibt, diese Art von Anfrage in HTTP auszudrücken.

Verwandte Themen