2017-12-09 2 views
1

Ok, also versuche ich, die gesamte Seitenquelle einer Webseite in eine Variable zu speichern und dann die Variable abzufragen, um zu sehen, ob sie ein Wort enthält, aber wenn ich die Seitenquelle auf a speichere Variable speichert es nur aus irgendeinem Grund <html><head></head><body></body></html>.Selen speichert keine ganze Seite Quelle Python

ich dies mit:

s = driver.page_source 
print(s) 

Es gibt nur dieses:

<html><head></head><body></body></html>. 
+0

Könnten Sie bitte das gesamte Code-Snippet hinzufügen? –

+0

Haben Sie zum Öffnen der Seite driver.get ("your_link") verwendet? –

+1

Es könnte mehrere Dinge geben. Eine besteht darin, dass Sie die Seitenquelle extrahieren, wenn sie noch nicht geladen ist. Sie versuchen, die Quelle zu laden und haben mehrere Fenster. Sie könnten Probleme mit der Verwendung von GeckoDriver/ChromeDriver haben –

Antwort

0

Ich glaube, Sie driver.page_source aufrufen, bevor die URL geladen werden.

Bitte erster Anruf

driver.get("yourdesiredurl") 

Dann rufen Sie die Methode

s = driver.page_source 
print(s)  

Dann werden Sie in der Lage sein, die ganze Seite Quelle zu erhalten.