2008-09-27 16 views
10

Welchen Algorithmus verwendet Twitter, um die 10 Themen zu ermitteln, die Sie unter search.twitter.com sehen können? Ich möchte diesen Algorithmus implementieren und möchte auch die 50 beliebtesten Themen (statt 10) zeigen. Können Sie den effizientesten Algorithmus beschreiben?Was ist der "Trendthemen" -Algorithmus von search.twitter.com?

Danke!

auch (Twitters API kann at- http://apiwiki.twitter.com/REST%20API%20Documentation gefunden werden), würde Ich mag Lage sein, den Algorithmus zu implementieren, indem sie durch die Öffentlichkeit schnittfenster Suche http://twitter.com/statuses/public_timeline.rss

Antwort

1

Also, was wahrscheinlich Twitter tut, ist es zählt die Anzahl der Erwähnungen eines bestimmten Begriffs minus Stoppwörter (Stoppwörter wie: do, me, du, ich, nicht, auf etc) So "die Katze ist aus der Tasche" und "mein Hund aß meine Katze" würde bedeuten diese Katze, Hund und Tasche wären die Begriffe, die es extrahiert hat (der Rest sind alle Stoppwörter) Und es zählt dann "Katze" als 2 Referenzen, so würde "Katze" ein Trendthema in diesem sein Fall.

12

Der Trendalgorithmus von Twitter ist nicht nur ein Volumen von Keywords. Das ist ein Teil davon, aber es gibt auch einen Decay-Faktor, so dass "Justin Beiber" nicht für immer Top-Trending ist.

Dieser Beitrag auf quora unterstützt dies. http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

Der Verfall wird in der Regel mit dem relativen Alter des Posts im Algorithmus durchgeführt, wodurch neueren Themen/Posts/etc mehr Gewicht verliehen wird.

siehe auch http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm

Verwandte Themen