10 Stimmen

Was ist der search.twitter.com-Algorithmus für "Trending Topics"?

Welchen Algorithmus verwendet Twitter, um die 10 Themen zu bestimmen, die man unter search.twitter.com ? Ich möchte diesen Algorithmus implementieren und auch die 50 beliebtesten Themen anzeigen (statt 10). Können Sie den effizientesten Algorithmus beschreiben?

Gracias.

(Twitters API ist zu finden unter http://apiwiki.twitter.com/REST%20API%20Documentation )

Außerdem würde ich den Algorithmus gerne durch eine Suche in der öffentlichen Zeitleiste implementieren können. http://twitter.com/statuses/public_timeline.rss

13voto

Steven Soroka Punkte 18749

Der Trending-Algorithmus von Twitter besteht nicht nur aus dem Volumen der Schlüsselwörter. Das ist ein Teil davon, aber es gibt auch einen Verfallsfaktor, so dass "Justin Beiber" nicht ewig an der Spitze der Trendingliste steht.

Dieser Beitrag auf Quora untermauert dies. http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+Algorithmus

Der Verfall erfolgt in der Regel durch die Verwendung des relativen Alters des Beitrags im Algorithmus, wodurch neuere Themen/Beiträge usw. stärker gewichtet werden.

siehe auch http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+Algorithmus

1voto

Marco Punkte 2453

Wahrscheinlich zählt Twitter die Anzahl der Erwähnungen eines bestimmten Begriffs abzüglich der Stoppwörter (Stoppwörter wie: do, me, you, I, not, on usw.) Also "die Katze ist aus dem Sack" und "mein Hund hat meine Katze gefressen" würde bedeuten, dass Katze, Hund und Sack die extrahierten Begriffe wären (der Rest sind alles Stoppwörter) Und dann zählt es "Katze" als 2 Referenzen, also wäre "Katze" in diesem Fall ein Trendthema.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X