Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Question

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Gefragt el 2 de Januar, 2009: Wann wurde die Frage gestellt
4275698 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich weiß, dass es möglich ist, ein Wort abzugleichen und dann die Übereinstimmungen mit anderen Tools umzukehren (z. B. grep -v). Ist es jedoch möglich, Zeilen abzugleichen, die kein bestimmtes Wort enthalten, z. B. hede, unter Verwendung eines regulären Ausdrucks?

Eingabe:

hoho
hihi
haha
hede

Code:

grep "" input

Gewünschte Ausgabe:

hoho
hihi
haha

Gefragt el 2 de Januar, 2009 von knaser

108 Stimmen

Wahrscheinlich ein paar Jahre zu spät, aber was ist falsch mit: ([^h]*(h([^e]|$)|he([^d]|$)|hed([^e]|$)))*? Die Idee ist einfach. Fahren Sie mit dem Abgleich fort, bis Sie den Beginn des unerwünschten Strings sehen, und gleichen Sie dann nur in den N-1 Fällen ab, in denen der String nicht abgeschlossen ist (wobei N die Länge des Strings ist). Diese N-1 Fälle sind "h gefolgt von nicht-e", "he gefolgt von nicht-d" und "hed gefolgt von nicht-e". Wenn es Ihnen gelungen ist, diese N-1 Fälle zu bestehen, haben Sie den unerwünschten String erfolgreich nicht abgeglichen, sodass Sie erneut mit der Suche nach [^h]* beginnen können.

Kommentiert el 29 de September, 2011 von stevendesu

441 Stimmen

@stevendesu: Versuche dies für 'ein-sehr-sehr-langes-Wort' oder noch besser einen halben Satz. Viel Spaß beim Tippen. Übrigens, es ist fast unleserlich. Weiß nicht über den Leistungseinfluss.

Kommentiert el 30 de Januar, 2012 von Peter Schuetze

14 Stimmen

@PeterSchuetze: Sicher ist es nicht schön für sehr sehr lange Wörter, aber es ist eine praktikable und korrekte Lösung. Obwohl ich keine Tests zur Leistung durchgeführt habe, würde ich mir vorstellen, dass es nicht allzu langsam ist, da die meisten nachfolgenden Regeln ignoriert werden, bis Sie ein h sehen (oder den ersten Buchstaben des Wortes, Satzes usw. sehen). Und Sie könnten den Regex-String für lange Zeichenfolgen leicht mithilfe iterativer Konkatenation generieren. Wenn es funktioniert und schnell generiert werden kann, ist Lesbarkeit wichtig? Dafür sind Kommentare da.

Kommentiert el 2 de Februar, 2012 von stevendesu

Anzeigen 3 weitere Kommentare

Answer 1

5 Antworten

Answer 2

24voto

ridgerunner Punkte 32111

So würde ich es machen:

^[^h]*(h(?!ede)[^h]*)*$

Genaue und effizienter als die anderen Antworten. Es implementiert Friedls Effizienztechnik "Schleifenausrollen" und erfordert viel weniger Backtracking.

Beantwortet el 20 de Dezember, 2013 von ridgerunner (32111 Punkte )

1 Stimmen

Was passiert, wenn das Suchwort 2 oder mehr der gleichen ersten Buchstaben enthält? wie hhede oder hedhe??

Kommentiert el 12 de November, 2022 von Jon Grah

Answer 3

22voto

Emma Punkte 26329

Eine weitere Option besteht darin, ein positives Look-Ahead hinzuzufügen und zu überprüfen, ob hede irgendwo in der Eingabezeile vorhanden ist, um dies zu verneinen, mit einem Ausdruck ähnlich wie:

^(?!(?=.*\bhede\b)).*$

mit Wortgrenzen.

Der Ausdruck wird im oberen rechten Panel von regex101.com erläutert, falls Sie ihn erkunden/vereinfachen/ändern möchten, und unter diesem Link können Sie sehen, wie er gegen einige Beispieleingaben übereinstimmen würde, wenn Sie möchten.

RegEx Circuit

jex.im visualisiert reguläre Ausdrücke:

Beantwortet el 1 de August, 2019 von Emma (26329 Punkte )

5 Stimmen

Ich verstehe nicht, wie das "innere" positive Lookahead nützlich ist.

Kommentiert el 5 de Februar, 2021 von Scratte

4 Stimmen

Es ist ein getarntes ^(?!.*\bhede\b).*$

Kommentiert el 22 de Oktober, 2021 von Wiktor Stribiżew

Answer 4

20voto

diyism Punkte 11786

Wenn Sie ein Zeichen passend machen möchten, um ein ähnliches Wort zu negieren, ähnlich wie bei einer negierten Zeichenklasse:

Zum Beispiel, ein String:

Verwenden Sie nicht:

Verwenden Sie:

Beachten Sie, dass "(?!bbb)." weder ein Lookbehind noch ein Lookahead ist, es handelt sich um einen aktuellen Blick, zum Beispiel:

"(?=abc)abcde", "(?!abc)abcde"

Beantwortet el 23 de Marsch, 2012 von diyism (11786 Punkte )

4 Stimmen

Es gibt kein "lookcurrent" in Perl Regexp's. Dies ist wirklich ein negativer Ausblick (Präfix (?!). Das Präfix für positive Ausblicke wäre (?=, während die entsprechenden Präfixe für Blickführungen (? und `(?<=` wären, Entspchichtig. Ein Ausblick bedeutet, dass Sie die nächsten Zeichen lesen (deshalb „voraus“), ohne sie zu verbrauchen. Ein Rückblick bedeutet, dass Sie Zeichen überprüfen, die bereits verbraucht wurden.

Kommentiert el 21 de Kann, 2012 von Didier L

1 Stimmen

Nicht sicher, wie (?!abc)abcde überhaupt Sinn ergibt.

Kommentiert el 5 de Februar, 2021 von Scratte

Answer 5

15voto

Kevin Fegan Punkte 1252

Der OP hat den Beitrag nicht spezifiziert oder Tag um den Kontext (Programmiersprache, Editor, Tool) anzugeben, in dem das Regex verwendet werden soll.

Für mich muss ich manchmal beim Bearbeiten einer Datei mit Textpad dies tun.

Textpad unterstützt einige Regex, unterstützt jedoch kein Lookahead oder Lookbehind, daher sind mehrere Schritte erforderlich.

Wenn ich alle Zeilen behalten möchte, die nicht den Text hede enthalten, würde ich es folgendermaßen tun:

1. Durchsuchen/Ersetzen der gesamten Datei, um am Anfang jeder Zeile mit Text eine eindeutige "Tag" hinzuzufügen.

    Suchstring:^(.)  
    Ersetzungsstring:<@#-unique-#@>\1  
    Alle ersetzen

2. Löschen aller Zeilen, die den Text hede enthalten (Ersetzungsstring ist leer):

    Suchstring:<@#-unique-#@>.*hede.*\n  
    Ersetzungsstring:  
    Alle ersetzen

3. Zu diesem Zeitpunkt enthalten alle verbleibenden Zeilen nicht den Text hede. Entfernen Sie den eindeutigen "Tag" aus allen Zeilen (Ersetzungsstring ist leer):

    Suchstring:<@#-unique-#@>
    Ersetzungsstring:  
    Alle ersetzen

Jetzt haben Sie den Originaltext, bei dem alle Zeilen mit dem Text hede entfernt wurden.

Wenn ich Etwas Anderes tun möchte, jedoch nur für Zeilen, die nicht den Text hede enthalten, würde ich es folgendermaßen tun:

1. Durchsuchen/Ersetzen der gesamten Datei, um am Anfang jeder Zeile mit Text eine eindeutige "Tag" hinzuzufügen.

    Suchstring:^(.)  
    Ersetzungsstring:<@#-unique-#@>\1  
    Alle ersetzen

2. Für alle Zeilen, die den Text hede enthalten, entfernen Sie den eindeutigen "Tag":

    Suchstring:<@#-unique-#@>(.*hede)
    Ersetzungsstring:\1  
    Alle ersetzen

3. Zu diesem Zeitpunkt enthalten alle Zeilen, die mit dem eindeutigen "Tag" beginnen, nicht den Text hede. Ich kann nun mein Etwas Anderes nur auf diese Zeilen anwenden.

4. Wenn ich fertig bin, entferne ich den eindeutigen "Tag" aus allen Zeilen (Ersetzungsstring ist leer):

    Suchstring:<@#-unique-#@>
    Ersetzungsstring:  
    Alle ersetzen

Beantwortet el 27 de April, 2013 von Kevin Fegan (1252 Punkte )

Answer 6

13voto

aelor Punkte 10370

Seit der Einführung von ruby-2.4.1 können wir den neuen Absent Operator in Ruby-Regular Expressions verwenden

vom offiziellen Dok

(?~abc) entspricht: "", "ab", "aab", "cccc", usw.
Es entspricht nicht: "abc", "aabc", "ccccabc", usw.

Also erledigt in Ihrem Fall ^(?~hede)$ die Arbeit für Sie

2.4.1 :016 > ["hoho", "hihi", "haha", "hede"].select{|s| /^(?~hede)$/.match(s)}
 => ["hoho", "hihi", "haha"]

Beantwortet el 23 de Marsch, 2017 von aelor (10370 Punkte )

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Eingabe:

Code:

Gewünschte Ausgabe:

Antworten

RegEx Circuit

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Eingabe:

Code:

Gewünschte Ausgabe:

Antworten

RegEx Circuit

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: