ich versuche, Text aus diesem HTML-Tag zu extrahierenWie man Daten von Webseiten extrahieren C#
sometext
, und ich habe diesen Code:
using System;
using System.Net;
using HtmlAgilityPack;
namespace GC_data_console
{
class Program
{
public static void Main(string[] args)
{
using (var client = new WebClient())
{
// Download the HTML
string html = client.DownloadString("https://www.requestedwebsite.com");
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
foreach(HtmlNode link in
doc.DocumentNode.SelectNodes("//span"))
{
HtmlAttribute href = link.Attributes["id='example1'"];
if (href != null)
{
Console.WriteLine(href.Value.ToString());
Console.ReadLine();
}
}
}
}
}
}
}
Aber ich bin immer noch nicht bekommen der Text "ein bisschen".
Aber wenn ich HtmlAttribute einfügen href = link.Attributes ["id"]; Ich bekomme alle ID-Namen.
Was mache ich falsch?
Können Sie die tatsächliche URL teilen, für die Sie den Inhalt abrufen möchten? Außerdem versuchen Sie, den Wert von 'HtmlAttribute' zu erhalten, nicht das Element. Was Sie versuchen müssen, ist "link.InnerText". –
Hallo, zum Beispiel von dieser Webseite https://www.geocaching.com/geocache/GC257YR_slivercup-studios-east und ich versuche, den Text aus dem Tag zu erhalten: SliverCup Studios East – Shiwers
Bekam es .... Hast du es anders versucht? Haben Sie auch debuggt und überprüft, ob Sie das richtige Element bekommen? –