3 Stimmen

Twitter-Datenauswertung: Der Grad der Trennung

Welche verfügbaren Algorithmen könnte ich verwenden, um mit Hilfe von Data Mining auf Twitter den Trennungsgrad zwischen zwei Personen zu ermitteln?

Wie ändert sich das, wenn sich der soziale Graph ständig ändert und aktualisiert wird?

Und dann, gibt es irgendeinen Dump von Twitter Social Graph Daten, die ich verwenden könnte, anstatt so viele API-Aufrufe zu machen, um neu zu beginnen.

5voto

Adrian Archer Punkte 2333

Desde el Twitter-API

Was ist der Data-Mining-Feed und kann ich darauf zugreifen?

Der Data-Mining-Feed ist eine erweiterte Version unserer /statuses/public_timeline REST API-Methode. Sie gibt 600 aktuelle öffentliche Status zurück, die jeweils für eine Minute zwischengespeichert werden. Sie können sie bis zu einmal pro Minute abrufen, um eine repräsentative Stichprobe der öffentlichen Statusmeldungen auf Twitter zu erhalten. Wir bieten dies kostenlos (und ohne Qualitätsgarantie) für Forscher und Hobbyisten an. Wir bitten Sie lediglich um eine kurze Beschreibung Ihrer Forschung oder Ihres Projekts und um die IP-Adresse(n), von der/denen Sie den Feed anfordern; füllen Sie einfach dieses Formular aus. Bitte beachten Sie, dass der Data Mining Feed nicht dazu gedacht ist, einen zusammenhängenden Stream aller öffentlichen Updates auf Twitter bereitzustellen; bitte lesen Sie oben für weitere Informationen über die bevorstehende "Firehose"-Lösung.

und siehe auch: Streaming-API-Dokumentation

0voto

arikfr Punkte 3195

Es gab ein Unternehmen, das einen Dump des sozialen Graphen anbot, aber es wurde vom Netz genommen und ist nicht mehr verfügbar. Wie Sie bereits bemerkt haben, ist es ziemlich schwierig, da er sich ständig ändert.

Ich würde empfehlen, ihre social_graph api Methoden zu überprüfen, da sie die meisten Informationen mit den wenigsten API-Aufrufen liefern.

0voto

LewisMc Punkte 331

Vielleicht gibt es noch andere Möglichkeiten, aber ich habe gerade die letzten 10 Minuten damit verbracht, etwas Ähnliches zu suchen und bin dabei auf dieses Q. gestoßen.

Ich würde einen ungerichteten (und gewichteten - da ich auch den Standort betrachten möchte) Graphen verwenden - verwenden Sie JgraphT oder ähnliches in Py; JGraphT ist Java-basiert, enthält aber verschiedene vorgefertigte Algos.

Sie können dann einen Algorithmus namens BellmanFord verwenden, der eine ganzzahlige Eingabe annimmt und den Graphen nach dem kürzesten Weg mit der ganzzahligen Eingabe sucht, und zwar nur mit der ganzzahligen Eingabe, im Gegensatz zu Dijkstras.

http://en.wikipedia.org/wiki/Bellman%E2%80%93Ford_algorithm

Ich habe es kürzlich in einem Projekt für die Flugroutenplanung verwendet, um den kürzesten Weg mit den kürzesten "Sprüngen" (Kanten) zu finden.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X