Text innerhalb eines HTML-Tags in einer lokalen Datei mit grep abrufen

Question

Text innerhalb eines HTML-Tags in einer lokalen Datei mit grep abrufen

Gefragt el 29 de August, 2010: Wann wurde die Frage gestellt
11293 Ansichten: Anzahl der Besuche der Frage
3 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Mögliches Duplikat:
RegEx stimmt mit offenen Tags überein, ausgenommen XHTML-Tags, die in sich geschlossen sind

Auszug aus der Eingabedatei

<TD class="clsTDLabelWeb" width="28%">Municipality:&nbsp;</TD>
<TD style="WIDTH: 394px" class="clsTDLabelSm" colSpan="5">
<span id="DInfo1_Municipality">JUPITER</span></TD>

Mein regulärer Ausdruck

(?<=<span id="DInfo1_Municipality">)([^</span>]*)

Ich habe eine HTML-Datei auf der Festplatte gespeichert. Ich möchte grep verwenden, um die Datei zu durchsuchen und den Inhalt eines bestimmten Bereichs auszugeben obwohl ich nicht weiß, ob dies eine korrekte Verwendung von grep ist. Wenn ich grep auf die Datei mit dem aus einer anderen Datei gelesenen Ausdruck anwende (damit ich keine Sonderzeichen durcheinander bringe), gibt es nichts aus. Ich habe den Ausdruck in RegExr getestet und er stimmt mit "JUPITER" überein, was genau das ist, was ich zurückgeben möchte. Ich danke Ihnen vielmals für Ihre Hilfe!

Gewünschter Output

JUPITER

Gefragt el 29 de August, 2010 von LakeMicrobe

Answer 1

3 Antworten

Answer 2

3voto

Dennis Williamson Punkte 322329

Versuchen Sie dies:

sed -n 's|^<span id="DInfo1_Municipality">\([^<]*\)</span></TD>$|\1|p' file

oder mit GNU grep und Ihre Regex:

grep -Po '(?<=<span id="DInfo1_Municipality">)([^</span>]*)'

Beantwortet el 29 de August, 2010 von Dennis Williamson (322329 Punkte )

Answer 3

1voto

Paul Creasey Punkte 27679

Grep unterstützt diese Art von Regex (lookbehind Assertions) nicht, und es ist ein sehr schlechtes Werkzeug für diese, aber für das gegebene Beispiel ist es machbar, wird unter vielen situtions brechen.

grep -io "<span id=\"DInfo1_Municipality\">.*</span>" file.htlm | grep -io ">[^<]*" | grep -io [^>]*

so etwas Verrücktes, keine gute Idee.

Beantwortet el 29 de August, 2010 von Paul Creasey (27679 Punkte )

Answer 4

1voto

ghostdog74 Punkte 305138

sed -n '/DInfo1_Municipality/s/<\/span.*//p' file | sed 's/.*>//'

Beantwortet el 29 de August, 2010 von ghostdog74 (305138 Punkte )

Text innerhalb eines HTML-Tags in einer lokalen Datei mit grep abrufen

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Text innerhalb eines HTML-Tags in einer lokalen Datei mit grep abrufen

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: