2014-07-01 9 views
5

file.htmlHTML Tidy Strippen Raum zu Beginn

word<i><span> <span>ratti</span></span></i> 

Befehl

Ausgabe

word<i>ratti</i> 

Wunsch Ausgang

word<i> ratti</i> 

Wo ist der Raum?

Log

line 1 column 1 - Warning: missing <!DOCTYPE> declaration 
line 1 column 1 - Warning: plain text isn't allowed in <head> elements 
line 1 column 8 - Warning: <span> is probably intended as </span> 
line 1 column 5 - Warning: replacing unexpected span by </span> 
line 1 column 33 - Warning: discarding unexpected </span> 
line 1 column 40 - Warning: discarding unexpected </i> 
line 1 column 1 - Warning: inserting missing 'title' element 
line 1 column 8 - Warning: trimming empty <span> 
Info: Document content looks like HTML 4.01 Transitional 
8 warnings, 0 errors were found! 

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> 
<html> 
<head> 
<meta name="generator" content= 
"HTML Tidy for Linux/x86 (vers 1st November 2003), see www.w3.org"> 
<title></title> 
</head> 
<body> 
word<i>ratti</i> 
</body> 
</html> 
+0

Scheint von ordentlich weggeworfen werden, haben Sie versucht unbreakable Raum  ? –

+0

Ich kann nichts mit dem HTML tun, es ist nur ein Beispiel von 10K + Zeilen Datei, und es gibt Tausende solcher Dateien, ich kann ihre HTML nicht bearbeiten. Es sollte eine Option in "ordentlich" geben, um in diesem Fall Räume zu erhalten. Übrigens, um Ihre Frage zu beantworten, ja, es funktioniert gut mit   –

+0

Sie können diese Option versuchen --add-xml-space ja –

Antwort

1

Dieses Problem scheint in neueren Versionen gelöst worden zu sein. Ich benutzte die Version von 2003. Ich nur updated tidy on my machine mit 2009. Version und damit ist die Ausgabe wie folgt.

content: word<i><span> <span>ratti</span></span></i> 
command: tidy file.html 
output: word <i><span><span>ratti</span></span></i> 

So wird es Raum jetzt zu bewahren, aber es ist den span Tag nicht löschen ist, sieht ohnehin dies wie eine richtige Antwort auf die Frage.