Webseiteninhalte mit Python abrufen?

Question

Webseiteninhalte mit Python abrufen?

Gefragt el 3 de Dezember, 2009: Wann wurde die Frage gestellt
172919 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich benutze Python 3.1, falls das hilft.

Wie auch immer, ich versuche, den Inhalt dieser Webseite zu bekommen. Ich habe ein wenig gegoogelt und verschiedene Dinge ausprobiert, aber sie haben nicht funktioniert. Ich vermute, dass dies eine einfache Aufgabe sein sollte, aber... ich bekomme es nicht. :/.

Ergebnisse von urllib, urllib2:

>>> import urllib2
Traceback (most recent call last):
  File "", line 1, in 
    import urllib2
ImportError: No module named urllib2
>>> import urllib
>>> urllib.urlopen("http://www.python.org")
Traceback (most recent call last):
  File "", line 1, in 
    urllib.urlopen("http://www.python.org")
AttributeError: 'module' object has no attribute 'urlopen'
>>>

Python 3 Lösung

Danke, Jason. :D.

import urllib.request
page = urllib.request.urlopen('http://services.runescape.com/m=hiscore/ranking?table=0&category_type=0&time_filter=0&date=1519066080774&user=zezima')
print(page.read())

Gefragt el 3 de Dezember, 2009 von Andrew

6 Stimmen

Duplikat: Suchen Sie nach urlib2 oder Webseite abrufen [Python] in SO und Sie werden 100 ähnliche Fragen finden.

Kommentiert el 3 de Dezember, 2009 von S.Lott

0 Stimmen

Habe urllib2 und urllib ausprobiert, aber keines hat funktioniert. (Erster Beitrag bearbeitet)

Kommentiert el 3 de Dezember, 2009 von Andrew

2 Stimmen

Er verwendet Python 3, also sind die APIs anders. Ich habe bestimmt etwas Neues gelernt, indem ich diese Antwort recherchiert habe.

Kommentiert el 3 de Dezember, 2009 von Jason R. Coombs

Anzeigen 3 weitere Kommentare

Answer 1

5 Antworten

Answer 2

61voto

Jonathan Hartley Punkte 14645

Wenn Sie an einem Projekt arbeiten, das Pakete von PyPI installiert, dann ist die beste und häufigste Bibliothek, um dies zu tun, requests. Es bietet viele praktische, aber leistungsstarke Funktionen. Verwenden Sie es so:

import requests
response = requests.get('http://hiscore.runescape.com/index_lite.ws?player=zezima')
print (response.status_code)
print (response.content)

Aber wenn Ihr Projekt seine eigenen Abhängigkeiten nicht installiert, d.h. auf in der Standardbibliothek enthaltene Funktionen beschränkt ist, dann sollten Sie eine der anderen Antworten konsultieren.

Beantwortet el 9 de Kann, 2014 von Jonathan Hartley (14645 Punkte )

Answer 3

35voto

Jason R. Coombs Punkte 38667

Weil du Python 3.1 verwendest, musst du die neuen Python 3.1 APIs verwenden.

Versuche:

urllib.request.urlopen('http://www.python.org/')

Alternativ scheint es, dass du von Python 2-Beispielen ausgehst. Schreibe es in Python 2 und verwende dann das 2to3-Tool, um es zu konvertieren. Auf Windows befindet sich 2to3.py in \python31\tools\scripts. Kann mir jemand sagen, wo sich 2to3.py auf anderen Plattformen befindet?

Bearbeiten

Heutzutage schreibe ich Python 2- und 3-kompatiblen Code, indem ich six verwende.

from six.moves import urllib
urllib.request.urlopen('http://www.python.org')

Angenommen, du hast six installiert, läuft das sowohl auf Python 2 als auch auf Python 3.

Beantwortet el 3 de Dezember, 2009 von Jason R. Coombs (38667 Punkte )

0 Stimmen

Ich bin auf Windows. Auf jeden Fall, danke, es hat gut funktioniert. (Die von dir verlinkte Seite sieht sehr hilfreich aus, übrigens. Danke dafür, besonders.)

Kommentiert el 3 de Dezember, 2009 von Andrew

1 Stimmen

Auf Ubuntu befand es sich im Pfad, daher musste ich nur das 2to3 -Befehl ausführen. Whereis sagt, dass es sich in /usr/bin/2to3 befindet.

Kommentiert el 15 de Dezember, 2012 von Azendale

2 Stimmen

Verdammt, Python 3 fängt langsam an, ein Problem zu werden: Man kann nicht einfach die erste Stack Overflow-Antwort kopieren und erwarten, dass sie noch funktioniert !

Kommentiert el 1 de Februar, 2013 von xApple

Anzeigen 2 weitere Kommentare

Answer 4

9voto

Zuko Punkte 2534

Wenn du mich fragst, probiere mal das aus

import urllib2
resp = urllib2.urlopen('http://hiscore.runescape.com/index_lite.ws?player=zezima')

und lies es auf normale Weise

page = resp.read()

Viel Glück trotzdem

Beantwortet el 14 de November, 2013 von Zuko (2534 Punkte )

Answer 5

5voto

Joe Koberg Punkte 23526

Mechanize ist ein tolles Paket zum "wie ein Browser agieren", wenn du Cookie-Status, etc. handhaben möchtest.

http://wwwsearch.sourceforge.net/mechanize/

Beantwortet el 3 de Dezember, 2009 von Joe Koberg (23526 Punkte )

Answer 6

2voto

JasDev Punkte 716

Sie können urlib2 verwenden und das HTML selbst analysieren.

Oder versuchen Sie Beautiful Soup, um einen Teil der Analyse für Sie zu erledigen.

Beantwortet el 3 de Dezember, 2009 von JasDev (716 Punkte )

0 Stimmen

Habe urllib2 und urllib ausprobiert, aber keines funktionierte. (Erster Beitrag bearbeitet)

Kommentiert el 3 de Dezember, 2009 von Andrew

0 Stimmen

Andrew, andere können Ihnen besser helfen, wenn Sie ausführlich beschreiben, was Sie versucht haben und welche Fehlermeldungen / unerwarteten Verhaltensweisen aufgetreten sind.

Kommentiert el 3 de Dezember, 2009 von micahwittman

0 Stimmen

Ich habe es in meinen ursprünglichen Beitrag eingefügt, weil ich keinen riesigen Kommentar haben wollte. :P.

Kommentiert el 3 de Dezember, 2009 von Andrew

Webseiteninhalte mit Python abrufen?

Python 3 Lösung

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Webseiteninhalte mit Python abrufen?

Python 3 Lösung

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: