2012-04-02 12 views
0

Gibt es eine gute Referenz, wie HTML-Kommentare zu analysieren robust besonders wo die html javascript enthält, die den KommentarParsen html Kommentare richtig

zum Beispiel brechen könnte:

  <!-- 
     <script type="text/javascript"> 
     for(var i = 10; i > 0; i--) { 
         if(myar[i].status > 3) { 
            ntlp++; 
         } 
     } 
     </script> 
     --> 

den beiden minus der und der mehr als 3 im Skript könnte als eine Verkettung betrachtet werden, die als '->' interpretiert wird (wenn Sie die html/sgml-Spezifikation korrekt befolgen).

Wie auch immer, gibt es eine Liste von Regeln/gotchas, um all das zu verarbeiten? In C wäre vorzuziehen, sonst ist Pseudo-Code auch toll.

dank

Ashod

+0

Ja, * verwende einen HTML-Parser * :) Siehe die HTML-Spezifikation für die Parser-Regeln. –

Antwort

1

Wenn Sie <!-- im Code zu erfüllen, alles weiter ein Kommentar bis --> ist. Welche anderen Regeln werden benötigt?

+0

Das stimmt nicht .. Die Regeln lauten: ' als Teil des Kommentars zu betrachten - nächste Vorkommen von Doppelstrich bedeutet, dass '>' das Tag schließt abwechselnd Regeln halten, da Doppelstriche auftreten –

+1

@ AshodApakian Wer hat dir das gesagt? – iehrlich

+0

Ich glaube nicht, dass das wahr ist. Ich bin mir ziemlich sicher, dass '' auch * geschützt * sein kann. (Und so wurde es als Hack in Netscape Version 3.0 und so verwendet.) In jedem Fall würde die Angabe der HTML * Spezifikation * diese Antwort machen (oder brechen). –