Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Question

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Gefragt el 2 de Januar, 2009: Wann wurde die Frage gestellt
4275700 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich weiß, dass es möglich ist, ein Wort abzugleichen und dann die Übereinstimmungen mit anderen Tools umzukehren (z. B. grep -v). Ist es jedoch möglich, Zeilen abzugleichen, die kein bestimmtes Wort enthalten, z. B. hede, unter Verwendung eines regulären Ausdrucks?

Eingabe:

hoho
hihi
haha
hede

Code:

grep "" input

Gewünschte Ausgabe:

hoho
hihi
haha

Gefragt el 2 de Januar, 2009 von knaser

108 Stimmen

Wahrscheinlich ein paar Jahre zu spät, aber was ist falsch mit: ([^h]*(h([^e]|$)|he([^d]|$)|hed([^e]|$)))*? Die Idee ist einfach. Fahren Sie mit dem Abgleich fort, bis Sie den Beginn des unerwünschten Strings sehen, und gleichen Sie dann nur in den N-1 Fällen ab, in denen der String nicht abgeschlossen ist (wobei N die Länge des Strings ist). Diese N-1 Fälle sind "h gefolgt von nicht-e", "he gefolgt von nicht-d" und "hed gefolgt von nicht-e". Wenn es Ihnen gelungen ist, diese N-1 Fälle zu bestehen, haben Sie den unerwünschten String erfolgreich nicht abgeglichen, sodass Sie erneut mit der Suche nach [^h]* beginnen können.

Kommentiert el 29 de September, 2011 von stevendesu

441 Stimmen

@stevendesu: Versuche dies für 'ein-sehr-sehr-langes-Wort' oder noch besser einen halben Satz. Viel Spaß beim Tippen. Übrigens, es ist fast unleserlich. Weiß nicht über den Leistungseinfluss.

Kommentiert el 30 de Januar, 2012 von Peter Schuetze

14 Stimmen

@PeterSchuetze: Sicher ist es nicht schön für sehr sehr lange Wörter, aber es ist eine praktikable und korrekte Lösung. Obwohl ich keine Tests zur Leistung durchgeführt habe, würde ich mir vorstellen, dass es nicht allzu langsam ist, da die meisten nachfolgenden Regeln ignoriert werden, bis Sie ein h sehen (oder den ersten Buchstaben des Wortes, Satzes usw. sehen). Und Sie könnten den Regex-String für lange Zeichenfolgen leicht mithilfe iterativer Konkatenation generieren. Wenn es funktioniert und schnell generiert werden kann, ist Lesbarkeit wichtig? Dafür sind Kommentare da.

Kommentiert el 2 de Februar, 2012 von stevendesu

Anzeigen 3 weitere Kommentare

Answer 1

5 Antworten

Answer 2

6voto

Anas R. Punkte 357

Solange Sie es mit Zeilen zu tun haben, markieren Sie einfach die negativen Treffer und zielen auf den Rest ab.

Tatsächlich verwende ich diesen Trick mit sed, weil ^((?!hede).)*$ von ihm nicht unterstützt wird.

Für die gewünschte Ausgabe

Markieren Sie den negativen Treffer: (z.B. Zeilen mit hede), indem Sie ein Zeichen verwenden, das im gesamten Text überhaupt nicht enthalten ist. Ein Emoji könnte für diesen Zweck wahrscheinlich eine gute Wahl sein.
```
s/(.*hede)/\1/g
```
Zielen Sie auf den Rest ab (die unmarkierten Zeichenfolgen: z.B. Zeilen ohne hede). Nehmen wir an, Sie möchten nur das Ziel behalten und den Rest löschen (wie Sie es möchten):
```
s/^.*//g
```

Für ein besseres Verständnis

Nehmen wir an, Sie möchten das Ziel löschen:

Markieren Sie den negativen Treffer: (z.B. Zeilen mit hede), indem Sie ein Zeichen verwenden, das im gesamten Text überhaupt nicht enthalten ist. Ein Emoji könnte für diesen Zweck wahrscheinlich eine gute Wahl sein.
```
s/(.*hede)/\1/g
```
Zielen Sie auf den Rest ab (die unmarkierten Zeichenfolgen: z.B. Zeilen ohne hede). Nehmen wir an, Sie möchten das Ziel löschen:
```
s/^[^].*//g
```
Entfernen Sie die Markierung:
```
s///g
```

Beantwortet el 15 de Juni, 2020 von Anas R. (357 Punkte )

Answer 3

5voto

cloudhopperpilot Punkte 21

^((?!hede).)*$ ist eine elegante Lösung, außer dass sie Zeichen verbraucht, sodass Sie sie nicht mit anderen Kriterien kombinieren können. Angenommen, Sie möchten beispielsweise das Nicht-Vorkommen von "hede" und das Vorkommen von "haha" überprüfen. Diese Lösung würde funktionieren, weil sie keine Zeichen verbraucht:

^(?!.*\bhede\b)(?=.*\bhaha\b)

Beantwortet el 26 de Marsch, 2019 von cloudhopperpilot (21 Punkte )

Answer 4

3voto

JohnP2 Punkte 1711

Eine einfachere Lösung besteht darin, den Not-Operator ! zu verwenden.

Ihre if-Anweisung muss "enthält" übereinstimmen und nicht "ausgeschlossen" übereinstimmen.

var contains = /abc/;
var excludes =/hede/;

if(string.match(contains) && !(string.match(excludes))){  //fortfahren...

Ich glaube, die Designer von RegEx haben die Verwendung von Not-Operatoren vorgesehen.

Beantwortet el 13 de September, 2016 von JohnP2 (1711 Punkte )

Answer 5

3voto

jaytea Punkte 1721

So verwenden Sie PCRE's Backtracking-Steuerungsverben, um eine Zeile ohne ein Wort abzugleichen

Hier ist eine Methode, die ich noch nicht gesehen habe:

/.*hede(*COMMIT)^|/

Wie es funktioniert

Zuerst versucht es, "hede" irgendwo in der Zeile zu finden. Wenn erfolgreich, sagt (*COMMIT) dem Motor, nicht nur im Falle eines Fehlers nicht zurückzuverfolgen, sondern auch keine weiteren Übereinstimmungen in diesem Fall zu versuchen. Dann versuchen wir, etwas abzugleichen, das unmöglich übereinstimmen kann (in diesem Fall ^).

Wenn eine Zeile "hede" nicht enthält, trifft die zweite Alternative, ein leeres Teilmuster, erfolgreich auf den Zeichenfolge zu.

Diese Methode ist nicht effizienter als ein negativer Ausblick, aber ich dachte, ich werde sie hier einfach hinschmeißen, falls jemand sie hübsch findet und eine Verwendung dafür in anderen, interessanteren Anwendungen findet.

Beantwortet el 11 de Oktober, 2017 von jaytea (1721 Punkte )

Answer 6

3voto

BrunoF Punkte 2833

Vielleicht finden Sie das auf Google, während Sie versuchen, einen Regex zu schreiben, der in der Lage ist, Segmente einer Zeile (im Gegensatz zu ganzen Zeilen) zu finden, die nicht einen bestimmten Teilstring enthalten. Es hat eine Weile gedauert, bis ich das herausgefunden habe, also teile ich es:

Gegeben sei ein String:

barfoobaz

Ich möchte Tags finden, die den Teilstring "bad" nicht enthalten.

/ wird und finden.

Beachten Sie, dass es zwei Sätze (Schichten) von Klammern gibt:

Die innerste ist für das Negative Lookahead (es ist keine Erfassungsgruppe)
Die äußerste wurde von Ruby als Erfassungsgruppe interpretiert, aber wir wollen nicht, dass sie erfasst wird, also habe ich ein ?: am Anfang hinzugefügt und sie wird nicht mehr als Erfassungsgruppe interpretiert.

Demo in Ruby:

s = 'barfoobaz'
s.scan(//)
# => ["", ""]

Beantwortet el 25 de April, 2018 von BrunoF (2833 Punkte )

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Eingabe:

Code:

Gewünschte Ausgabe:

Antworten

Für die gewünschte Ausgabe

Für ein besseres Verständnis

So verwenden Sie PCRE's Backtracking-Steuerungsverben, um eine Zeile ohne ein Wort abzugleichen

Wie es funktioniert

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Regulärer Ausdruck, um eine Zeile zu finden, die kein Wort enthält

Eingabe:

Code:

Gewünschte Ausgabe:

Antworten

Für die gewünschte Ausgabe

Für ein besseres Verständnis

So verwenden Sie PCRE's Backtracking-Steuerungsverben, um eine Zeile ohne ein Wort abzugleichen

Wie es funktioniert

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: