371 Stimmen

HTML aus Zeichenketten in Python entfernen

from mechanize import Browser
br = Browser()
br.open('http://somewebpage')
html = br.response().readlines()
for line in html:
  print line

Wenn ich eine Zeile in einer HTML-Datei ausdrucke, suche ich nach einer Möglichkeit, nur den Inhalt jedes HTML-Elements und nicht die Formatierung selbst anzuzeigen. Wenn er findet '<a href="whatever.com">some text</a>' wird nur "etwas Text" gedruckt, '<b>hello</b>' druckt 'hallo', usw. Wie könnte man dies tun?

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X