2009-08-14 8 views
0

Wenn Sie etwas auf Facebook oder Digg teilen, erzeugt es eine Zusammenfassung der Seite. Wie würde ich das in Perl machen? Welche Algorithmen gibt es?Wie kann ich eine Website-Zusammenfassung mit Perl erstellen?

Zum Beispiel:

Wenn ich auf Facebook gehen und versuchte, diese Frage als Link zu teilen: How can I create a website summary with Perl?

Es holt? „Facebook/Digg Webseite Zusammenfassung bekommen - Stack-Überlauf“ als Titel (das ist nur der Titel der Seite) und [... unvollständige Frage?]

+2

Können Sie erklären, die Art der Zusammenfassung Sie genauer suchen? – Mark

Antwort

1

Grundsätzlich wollen Sie die URL kratzen und finden Sie den „most significant Absatz“, die das erste <div> oder <p> Elem sein könnten Ent nach dem ersten <h2> oder <h1>, je nach Layout der Seite.

1

Sie können überprüfen und sehen, ob es eine Meta-Beschreibung auf der Seite gibt, aber das macht Sie demjenigen, der die Meta-Beschreibung geschrieben hat, ausgeliefert.

+0

Ich habe versucht, dies zu tun, aber die meisten Artikel enthalten sie nicht. – Timmy

2

Sie bedeuten teilen einen Link Unter der Annahme ...

Normalerweise ist die Zusammenfassung durch den Benutzer geschrieben wird, um die URL einreichen.

  • die ersten 100 oder so Zeichen des Textteils Mit Hilfe von (an sich nicht leicht)
  • Verwendung von Metadaten wie die Beschreibung oder Schlüsselwörter (oft leer: Wenn Sie eine Zusammenfassung schreiben automagically kann dies erreicht werden durch oder spammed)
  • kontextrelevanten Zusammenfassungen wie recreating Google snippets (sorry seine PHP aber einfach)
  • Tags/Keywords aus dem Dokument so etwas wie die Yahoo Keyword Extractor API oder Ihre eigenen Keyword-Dichte-Funktion

Am besten fragen Sie den Benutzer!

Hoffnung, dass etwas hilft :)

Verwandte Themen