2 Stimmen

Abschaben von *.aspx-Inhalten mit Python

Ich habe Schwierigkeiten beim Scraping einer dynamisch generierten Tabelle in ASPX. Ich versuche, die Benzinpreise von einer Seite wie dieser Gaspreise zu scrapen. Ich kann alle Informationen in der Benzinpreistabelle extrahieren (Adresse, Datum usw.), außer dem tatsächlichen Benzinpreis.

Gibt es einen Weg, wie ich die Benzinpreise scrapen könnte? Also irgendwie eine Textdarstellung davon bekommen. Ich kenne mich nicht sehr gut mit ASP/ASPX aus - aber das, was jetzt generiert wird, erscheint nicht im endgültigen HTML. Ich benutze Python für das Scrapen, aber das ist irrelevant, es sei denn, es gibt eine spezifische Bibliothek...

Vielen Dank im Voraus.

4voto

spender Punkte 111351

Der Ursprung der Seite (aspx) ist hier nicht das Problem.

~~

Es scheint, als würden sie aktiv versuchen, Scraping-Versuche zu vereiteln. Die Zahlen sind keine Schriften, sondern mehrere div-Elemente nebeneinander mit Hintergrundbildern, die Zahlen darstellen. Sie wollen wirklich nicht gescrapt werden.

~~

(natürlich, wenn Sie wirklich entschlossen wären, könnten Sie wahrscheinlich den Klassennamen des divs zuordnen... Sie sind nicht sehr gut 'verschlüsselt')

Beachten Sie den Copyright-Hinweis am Ende der verlinkten Seite

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X