Teil einer Regex-Übereinstimmung extrahieren

Question

Teil einer Regex-Übereinstimmung extrahieren

Gefragt el 25 de August, 2009: Wann wurde die Frage gestellt
274187 Ansichten: Anzahl der Besuche der Frage
1 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich möchte einen regulären Ausdruck, um den Titel aus einer HTML-Seite zu extrahieren. Derzeit habe ich dies:

title = re.search('<title>.*</title>', html, re.IGNORECASE).group()
if title:
    title = title.replace('<title>', '').replace('</title>', '')

Gibt es einen regulären Ausdruck, der nur den Inhalt von <title> extrahiert, so dass ich die Tags nicht entfernen muss?

Gefragt el 25 de August, 2009 von hoju

10 Stimmen

Wow, ich kann nicht glauben, dass all die Antworten dazu auffordern, die gesamte HTML-Seite zu analysieren, nur um einen einfachen Titel zu extrahieren. Was für ein Overkill!

Kommentiert el 27 de August, 2009 von hoju

5 Stimmen

Der Titel der Frage sagt alles - das angegebene Beispiel geschieht HTML zu sein, aber das allgemeine Problem ist ... allgemein.

Kommentiert el 25 de Kann, 2017 von Phil

Answer 1

1 Antworten

Answer 2

1voto

Martim Passos Punkte 117

Gibt es einen bestimmten Grund, warum niemand die Verwendung von Lookahead und Lookbehind vorgeschlagen hat? Ich habe hier versucht, genau das Gleiche zu tun und (?<=<title>).+(?=<\/title>) funktioniert hervorragend. Es wird nur übereinstimmen, was zwischen Klammern, so dass Sie nicht haben, um die ganze Gruppe Sache zu tun.

Beantwortet el 18 de Kann, 2021 von Martim Passos (117 Punkte )

Teil einer Regex-Übereinstimmung extrahieren

Antwort

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Teil einer Regex-Übereinstimmung extrahieren

Antwort

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: