2017-05-29 1 views
0

Ich habe den folgenden Code zum Scraping der folgenden HTML-Tabelle:Scrape HTML-Tabelle. UWP und C#

Code, der nur den 'Service' in der Tabelle bekommt.

var MobileSiteLinks = MobileDocument.DocumentNode.SelectNodes("//div[starts-with(@class,'content')]//a[starts-with(@class,'service')]"); 

        foreach (var a in MobileSiteLinks) 
        { 
         DestinationPlaces newPlace = new DestinationPlaces(); 
         newPlace.Services = a.InnerText.Trim(); 
         places4.Add(newPlace); 
        } 

<table class="busexpress-clientwidgets-departures-departureboard"> 
<thead><tr class="rowStopName"><th colspan="3" title="briamaw" data- lat="50.8016420087726" data-lng="-0.0475264219580729" data-bearing="">Cranleigh Avenue</th><tr> 
<tr class="textHeader"><th colspan="3">text briamaw to 84268 for live times</th><tr> 
<tr class="rowHeaders"><th>service</th><th>destination</th><th>time</th><tr></thead><tbody> 
<tr class="rowServiceDeparture"> 
<td class="colServiceName">27</td> 
<td class="colDestination" title="Saltdean">Saltdean</td> 
<td class="colDepartureTime" data-departureTime="29/05/2017 15:04:00" title="1 mins">1 mins</td> 
</tr> 
<tr class="rowServiceDeparture"> 
<td class="colServiceName">14B</td> 
<td class="colDestination" title="Peacehaven">Peacehaven</td> 
<td class="colDepartureTime" data-departureTime="29/05/2017 15:19:00" title="16 mins">16 mins</td> 
</tr> 
<tr class="rowServiceDeparture"> 
<td class="colServiceName">12A</td> 
<td class="colDestination" title="Eastbourne">Eastbourne</td> 
<td class="colDepartureTime" data-departureTime="29/05/2017 15:22:00" title="19 mins">19 mins</td> 
</tr> 
<tr class="rowServiceDeparture"> 
<td class="colServiceName">27</td> 
<td class="colDestination" title="Saltdean">Saltdean</td> 
<td class="colDepartureTime" data-departureTime="29/05/2017 15:23:00" title="20 mins">20 mins</td> 
</tr> 

Ich bin mir bewusst, dass SelectNodes jetzt in UWP-Anwendungen nicht unterstützt wird. Wie bekomme ich dieselben Informationen mit dem neuen Format? jetzt

Dank

Antwort

0

ich weiß, dass Select in UWP nicht apps unterstützt.

UWP App hat SelectNodes relative Methoden. Wenn Sie die obige Tabelle als XML-Datei speichern, können Sie die Klasse Xml​Document verwenden, die die Methode SelectNodes(String) enthält. Zum Beispiel:

Windows.Data.Xml.Dom.XmlDocument doc; 
StorageFile storageFile = await StorageFile.GetFileFromApplicationUriAsync(new Uri("ms-appx:///Assets/Onetable.xml")); 
Windows.Data.Xml.Dom.XmlLoadSettings loadSettings = new Windows.Data.Xml.Dom.XmlLoadSettings(); 
doc = await Windows.Data.Xml.Dom.XmlDocument.LoadFromFileAsync(storageFile, loadSettings); 
var xpath = "//tr[@class='rowServiceDeparture']"; 
var MobileSiteLinks = doc.SelectNodes(xpath); 

Weitere Einzelheiten, die Sie beziehen können XmlDocument official sample.

Ihr Code-Snippet sieht so aus, als ob Sie das HtmlAgilityPack-Paket verwenden. Wenn der obige Inhalt nur als HTML-Format gespeichert wird, können Sie auch HtmlAgilityPack in der UWP-App verwenden, er enthält auch die SelectNodes-Methode, wie Sie oben gezeigt haben. Achten Sie darauf, HtmlAgilityPack for .NET Core zu verwenden, die in UWP unterstützt wird.

WebRequest request = HttpWebRequest.Create("url"); 
WebResponse response = await request.GetResponseAsync(); 
Stream stream = response.GetResponseStream(); 
var result = ""; 
using (StreamReader sr = new StreamReader(stream)) 
{ 
    result = sr.ReadToEnd(); 
} 
HtmlDocument MobileDocument = new HtmlDocument(); 
MobileDocument.LoadHtml(result); 
var nodes = MobileDocument.DocumentNode.SelectNodes("//tr[@class='rowServiceDeparture']"); 
+0

Danke. Benutzte das HtmlAgilityPack für das Netz und das funktionierte mit meinem bestehenden Code! –