2012-08-24 16 views
7

In meinem Code möchte ich das Img-Tag entfernen, das keinen src-Wert hat. Ich verwende HTMLAgilitypack HtmlDocument Objekt. Ich finde die Img, die nicht src Wert und versuchen, es zu entfernen .. aber es gibt mir Fehler Sammlung wurde geändert; Aufzählungsoperation wird möglicherweise nicht ausgeführt. Kann mir jemand dabei helfen? Der Code, den ich verwendet habe, ist:HTML-Knoten aus HTML-Dokument entfernen: HTMLAgilityPack

foreach (HtmlNode node in doc.DocumentNode.DescendantNodes()) 
{ 
    if (node.Name.ToLower() == "img") 
    {        
      string src = node.Attributes["src"].Value; 
      if (string.IsNullOrEmpty(src)) 
      { 
       node.ParentNode.RemoveChild(node, false);  
      } 
    } 
    else 
    { 
      ..........// i am performing other operations on document 
    } 
} 

Antwort

6

Was ich getan habe ist:

List<string> xpaths = new List<string>(); 
    foreach (HtmlNode node in doc.DocumentNode.DescendantNodes()) 
    { 
         if (node.Name.ToLower() == "img") 
         { 
          string src = node.Attributes["src"].Value; 
          if (string.IsNullOrEmpty(src)) 
          { 
           xpaths.Add(node.XPath); 
           continue; 
          } 
         } 
    } 

    foreach (string xpath in xpaths) 
    { 
      doc.DocumentNode.SelectSingleNode(xpath).Remove(); 
    } 
17

Es scheint, sind Sie durch die Verwendung HtmlNode.RemoveChild Methode, um die Sammlung während der Enumeration ändern.

Um dies zu beheben, müssen Sie Ihre Knoten in eine separate Liste/Array kopieren, indem Sie z. Enumerable.ToList<T>() oder Enumerable.ToArray<T>().

var nodesToRemove = doc.DocumentNode 
    .SelectNodes("//img[not(string-length(normalize-space(@src)))]") 
    .ToList(); 

foreach (var node in nodesToRemove) 
    node.Remove(); 

Wenn ich richtig bin, wird das Problem verschwinden.

+0

Danke, es funktioniert für mich ..! – Priya

+0

@Piya, froh, das zu hören. Aber ich denke, mit einem Xpath-Ausdruck ist es einfacher, Ihren Code lesbarer zu machen (wählen Sie einfach alle Knoten aus, die mit einem Ausdruck entfernt werden sollen). – Alex

+0

, Ja Sie haben Recht.Okay werde ich es tun .. Danke nochmal! – Priya

2
var emptyImages = doc.DocumentNode 
.Descendants("img") 
.Where(x => x.Attributes["src"] == null || x.Attributes["src"].Value == String.Empty) 
.Select(x => x.XPath) 
.ToList(); 

emptyImages.ForEach(xpath => { 
     var node = doc.DocumentNode.SelectSingleNode(xpath); 
     if (node != null) { node.Remove(); } 
    });