2017-11-02 2 views
0
ist

Ho kann ich etwas extrahieren, die außerhalb HTML-Körper resident ist und keine Markierung mit selen webdriver für z. Ich möchte die Entity_ID von der Unterseite der Seite extrahieren.Extrahieren Sie Text, der außerhalb html-Körper

<!DOCTYPE html ......"> 
<html xml:lang="en" lang="en" dir="ltr"> 
<head> 
    </head> 
    <body> 
     <form....> 
     ...... 
     </form> 
    </body> 
    <!-- 
    Host Name: ********.com 
    Interaction ID: 111111111 
    Iteration: 1 
    Entity ID: 111111111111 
    ApplicationID: 11111111111 
    Image Location: ********** 
    Operating Environment: staging 
    Page Name: ************** 
</html> 
+0

Siehe: [? Wie kann ich tun, X] (https://meta.stackoverflow.com/questions/253069/whats-the-appropriate-new- current-close-reason-for-wie-do-i-do-x) Die Erwartung an SO ist, dass der Benutzer, der eine Frage stellt, nicht nur recherchiert, um seine eigene Frage zu beantworten, sondern auch Forschung, Code-Versuche und Ergebnisse teilt. Dies zeigt, dass Sie sich die Zeit genommen haben, sich selbst zu helfen, es rettet uns davor, offensichtliche Antworten zu wiederholen, und vor allem hilft es Ihnen, eine spezifischere und relevantere Antwort zu bekommen! Siehe auch: [ask] – JeffC

Antwort

0

Verwenden WebDriver#getPageSource() Methode:

 driver.get("http://your.page.com") 

     String pageSrc = driver.getPageSource(); 

     int idx = pageSrc.indexOf("Entity ID:"); 
     if(idx>= 0) { 
      System.out.println(pageSrc.substring(idx, pageSrc.indexOf("\n", idx))); 
     } 
+0

Oben genannte Lösung funktioniert, Vielen Dank! –

Verwandte Themen