Wie findet man alle Vorkommen einer Teilzeichenkette?

Question

Wie findet man alle Vorkommen einer Teilzeichenkette?

Gefragt el 12 de Januar, 2011: Wann wurde die Frage gestellt
661212 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Python hat string.find() y string.rfind() um den Index einer Teilzeichenkette in einer Zeichenkette zu ermitteln.

Ich frage mich, ob es so etwas gibt wie string.find_all() die alle gefundenen Indizes zurückgeben kann (nicht nur den ersten vom Anfang oder den ersten vom Ende).

Zum Beispiel:

string = "test test test test"

print string.find('test') # 0
print string.rfind('test') # 15

#this is the goal
print string.find_all('test') # [0,5,10,15]

Gefragt el 12 de Januar, 2011 von nukl

20 Stimmen

Was sollte 'ttt'.find_all('tt') zurückkehren?

Kommentiert el 12 de Januar, 2011 von Santiago Alessandri

4 Stimmen

Sollte er '0' zurückgeben. Natürlich muss es in einer perfekten Welt auch eine 'ttt'.rfind_all('tt') was '1' ergeben sollte.

Kommentiert el 12 de Januar, 2011 von nukl

5 Stimmen

Reine Anfragen zum Schreiben von Code sind auf Stack Overflow tabu - wir erwarten, dass sich die Fragen hier auf spezifisch Programmierprobleme - aber wir helfen Ihnen gerne, sie selbst zu schreiben! Sagen Sie es uns was Sie ausprobiert haben und wo Sie feststecken. Dies wird uns auch helfen, Ihre Frage besser zu beantworten.

Kommentiert el 5 de Februar, 2016 von Cerbrus

Anzeigen 3 weitere Kommentare

Answer 1

5 Antworten

Answer 2

3voto

Valentin Goikhman Punkte 87

Diese Funktion betrachtet nicht alle Positionen innerhalb der Zeichenkette und verschwendet keine Rechenressourcen. Mein Versuch:

def findAll(string,word):
    all_positions=[]
    next_pos=-1
    while True:
        next_pos=string.find(word,next_pos+1)
        if(next_pos<0):
            break
        all_positions.append(next_pos)
    return all_positions

um es zu verwenden, rufen Sie es so auf:

result=findAll('this word is a big word man how many words are there?','word')

Beantwortet el 13 de Januar, 2020 von Valentin Goikhman (87 Punkte )

Answer 3

3voto

Uri Goren Punkte 12492

Wenn Sie nach einer großen Anzahl von Schlüsselwörtern in einem Dokument suchen, verwenden Sie Flashtext

from flashtext import KeywordProcessor
words = ['test', 'exam', 'quiz']
txt = 'this is a test'
kwp = KeywordProcessor()
kwp.add_keywords_from_list(words)
result = kwp.extract_keywords(txt, span_info=True)

Flashtext läuft schneller als Regex bei großen Listen von Suchbegriffen.

Beantwortet el 28 de September, 2018 von Uri Goren (12492 Punkte )

Answer 4

2voto

Ruman Khan Punkte 51

Dies ist die Lösung einer ähnlichen Frage von hackerrank. Ich hoffe, dies könnte Ihnen helfen.

import re
a = input()
b = input()
if b not in a:
    print((-1,-1))
else:
    #create two list as
    start_indc = [m.start() for m in re.finditer('(?=' + b + ')', a)]
    for i in range(len(start_indc)):
        print((start_indc[i], start_indc[i]+len(b)-1))

Ausgabe:

aaadaa
aa
(0, 1)
(1, 2)
(4, 5)

Beantwortet el 20 de Januar, 2020 von Ruman Khan (51 Punkte )

Answer 5

2voto

WangSung Punkte 111

Wenn Sie ohne re(regex) verwenden wollen, dann:

find_all = lambda _str,_w : [ i for i in range(len(_str)) if _str.startswith(_w,i) ]

string = "test test test test"
print( find_all(string, 'test') ) # >>> [0, 5, 10, 15]

Beantwortet el 5 de November, 2021 von WangSung (111 Punkte )

Answer 6

2voto

Mike Punkte 83

Hier ist eine Lösung, die ich mit, mit Zuweisung Ausdruck (neue Funktion seit Python 3.8) kam:

string = "test test test test"
phrase = "test"
start = -1
result = [(start := string.find(phrase, start + 1)) for _ in range(string.count(phrase))]

Ausgabe:

[0, 5, 10, 15]

Beantwortet el 8 de April, 2022 von Mike (83 Punkte )

Wie findet man alle Vorkommen einer Teilzeichenkette?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie findet man alle Vorkommen einer Teilzeichenkette?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: