2 Stimmen

Facebook-Seitendetails und die RESTful-API?

Hallo, ich habe eine Liste von Facebook-Seiten-URLs

eg...
http://www.facebook.com/daftpunk
http://www.facebook.com/DavidGuetta
...

Was ist der beste Weg, um:

  • Prüfen Sie, ob diese Urls eigentlich für Facebook-Seiten und no Profile

  • Sammeln Sie Details wie # Anzahl der Fans von diesen Seiten

Für Hilfe wäre ich sehr dankbar.

3voto

Karl B Punkte 1587

Ohne irgendwelche Inhalte zu scrapen (was ohnehin gegen die Nutzungsbedingungen von Facebook verstößt):

  1. Extrahieren Sie den Teil des Benutzernamens aus der URL d.h. den Teil nach dem www.facebook.com/
  2. Führen Sie eine FQL-Abfrage der Form select fan_count from page where username='michaeljackson'
  3. Wenn ein Ergebnis zurückgegeben wird, wissen Sie, dass es sich um eine Seite und nicht das Profil eines Benutzers.

Siehe die Seite FQL-Tabelle für andere Daten, die Sie mit demselben Aufruf abrufen können.

2voto

Corey Goldberg Punkte 56036

Verwenden. urllib2 o pyfacebook um den Inhalt abzurufen

verwenden. BeautifulSoup o lxml um es zu analysieren

verwenden Sie die zu Modul (reguläre Ausdrücke) zur Extraktion von Inhalten für Ihre Überprüfung und Datenerfassung

1voto

GSto Punkte 40158

Die Anzahl der Fans befindet sich in einem a-Tag mit der Klasse 'FanManager'. Sie können Beautiful Soup verwenden, um den Inhalt dieses a-Tags zu erhalten, und reguläre Ausdrücke, um die Daten aus der Zeichenkette (z. B. 1.000.000 Fans) als int oder was auch immer Sie möchten zu erhalten.

Um festzustellen, ob die Seite existiert, überprüfen Sie einige der Tags, um zu sehen, ob Sie sich auf der Seite 404 befinden.

0voto

Seb Punkte 15918

Sie können verwenden Schrott o BeautifulSoup um den Inhalt zu scrapen.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X