2009-04-27 2 views
2

Was ist der beste Weg, um große Mengen von sehr ähnlichen Webseiten programmatisch in ein neueres CSS-basiertes Layout umzuwandeln?Wie transformiert man große Gruppen von ähnlich schlechten HTML-Seiten in hochwertige CSS-basierte Seiten?

Ich ändere alle Inhalte einer alten Website in ein neues CSS-basiertes Layout. Viele der Seiten sind sehr ähnlich und ich möchte den Prozess automatisieren können.

Was ich derzeit denke, ist, die Seiten zu lesen, die HtmlAgilityPack verwenden, und eine Methode für jede Gruppe ähnlicher Seiten zu erstellen, die den Ausgabetext erstellen.

Was denken Sie, ist der beste Weg, dies zu tun? Die Seiten unterscheiden sich meistens durch Dinge wie die .jpg Datei wird für das Bild verwendet, oder wie viele Gruppen von Überschrift-Bild-Text gibt es auf dieser Seite

EDIT: Ich kann keinen anderen Dateityp als .html verwenden, denn das ist alles, was ich tun darf. Irgendwelche Vorschläge?

EDIT2: Im Idealfall wäre ich auch in der Lage, dies generisch genug zu machen, dass ich es für viele verschiedene Gruppen von HTML-Dateien verwenden könnte, indem ich nur ein paar bewegliche Teile umschalte.

SAMPLE OF TYPICAL PAGE

Der obige Link ist ein Beispiel dessen, was ich mit zu tun habe. Die Teile, die zwischen den Seiten wären unterscheiden würden:

  • die Meta-Description-Tag
  • verschiedene Header, especailly der Haupt-Header
  • fast jedes Bild auf der Seite wird
  • der Text für jedes Video neu wird einzigartig, aber sie werden zusammen in ähnlicher Brocken
  • die Video-Dateien gruppiert werden, und Videogrößen eindeutig sein

Alles andere ist gleich, und das Format der Seiten ist auch gleich.

EDIT3: Im Zweifelsfall ist es vielleicht hilfreich, einen Code zu schreiben, der die Seiten für mich schreibt. Ich muss nur die Teile der Originale, die variabel sind, ausschneiden und in eine Datendatei einfügen, die gelesen und zum Schreiben der neuen Versionen verwendet wird.

+0

Es könnte ein wenig einfacher sein, Ihnen zu helfen, wenn Sie ein Beispiel einer typischen Seite zur Verfügung stellen und wo die Unterschiede auftreten könnten, nur damit wir ein Gefühl dafür entwickeln können, mit welcher Art von Seiten Sie es zu tun haben. .. –

+0

ok, lass mich das jetzt tun. –

Antwort

0

Während dies vielleicht ein bisschen glib klingen, ist die beste echte Option I Rent-A-Coder

+0

Gute Idee, unter der Annahme, dass die Information nicht proprietär ist, kann es schneller sein, jemanden $ 50 zu bezahlen, dann Zeit damit zu verbringen, es selbst zu tun. – Jared

+1

Sicher, wenn Sie mit einer großen Gruppe ähnlich beschissener _css_ Seiten enden möchten. –

+0

Ja, es bietet sich an, die Möglichkeit, jemanden einzustellen, um Arbeiten zu erledigen, die im Allgemeinen besser für die Verarbeitung von Mensch und Maschine geeignet sind, zu verachten: Rolle: –

0

auf der Seite abhängig wäre anbieten könnte, könnten Sie Skripte in Perl oder einer anderen Skriptsprache Ihres bequem mit schreiben, so viel zu tun, wie möglich und lassen sie etwas notieren, das sie nicht reparieren oder nicht verstehen konnten.

1

Es hängt davon ab, wie ähnlich "sehr ähnlich" tatsächlich ist. Wenn Sie meinen, dass sie effektiv eine Reihe von Vorlagen verwenden, dann würde ich wahrscheinlich neue Vorlagen für das neue Design mit Template-Toolkit erstellen und die Daten mit Template::Extract aussaugen. Möglicherweise werden die Daten in einer lokalen Datenbank gespeichert, um die Neuerstellung der Seiten in Zukunft zu erleichtern.

+0

http://www.shaolin.org/video-clips-3/sabah2007/sabah01.html ist ein Beispiel. Denkst du, deine Ideen würden dafür funktionieren? –

1

Ich denke, es hängt davon ab, wie viele Seiten es gibt, wenn es nicht zu viele gibt, könnten Sie eine Vorlage erstellen und einen WYSIWYG-Editor verwenden, um den Inhalt zu kopieren und einzufügen.

Wenn Sie es jedoch programmatisch tun müssen, würde ich empfehlen, die HTML zu analysieren, um den Inhalt zu extrahieren. Oder aufräumen, Wenn Sie Zugriff darauf haben, können Sie Expression Web, die ich für eine ähnliche Aufgabe verwendet haben, können Sie den HTML-Code und nur die Header-Tags, Absatz usw. lassen, dann können Sie CSS zum Formatieren anwenden es in dem Design, das Sie wünschen.

Allerdings könnte es länger dauern, Code zu schreiben, als es manuell zu tun. Manchmal ist nichts schneller als mit der Hand.

Viel Glück

+0

Es gibt viele Seiten. Nur ein Beispiel, das ich mache, hat 38 Seiten. Aber das ist nur einer. Es gibt wahrscheinlich 20-30 davon. –

0

Wenn mit alten konfrontiert, oft generierten Code wie diese, neige ich dazu, auf die Suche zu lehnen und in meinem Texteditor ersetzen.

Klingt schrecklich, nicht wahr?

Ernsthaft, wenn Sie einen leistungsstarken Editor erhalten, der die Suche nach mehreren Dateien und/oder regulären Ausdrücken unterstützt, kann der Großteil des bösartigen Codes entfernt werden. Es ist keine perfekte Wissenschaft um es gelinde auszudrücken, und einige manuelle Manipulationen können notwendig sein, um es in eine "nützliche" Form zu bringen, aber es nimmt den Großteil der Aufräumarbeiten weg.

Verwandte Themen