Wie findet man alle Vorkommen einer Teilzeichenkette?

Question

Wie findet man alle Vorkommen einer Teilzeichenkette?

Gefragt el 12 de Januar, 2011: Wann wurde die Frage gestellt
661210 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Python hat string.find() y string.rfind() um den Index einer Teilzeichenkette in einer Zeichenkette zu ermitteln.

Ich frage mich, ob es so etwas gibt wie string.find_all() die alle gefundenen Indizes zurückgeben kann (nicht nur den ersten vom Anfang oder den ersten vom Ende).

Zum Beispiel:

string = "test test test test"

print string.find('test') # 0
print string.rfind('test') # 15

#this is the goal
print string.find_all('test') # [0,5,10,15]

Gefragt el 12 de Januar, 2011 von nukl

20 Stimmen

Was sollte 'ttt'.find_all('tt') zurückkehren?

Kommentiert el 12 de Januar, 2011 von Santiago Alessandri

4 Stimmen

Sollte er '0' zurückgeben. Natürlich muss es in einer perfekten Welt auch eine 'ttt'.rfind_all('tt') was '1' ergeben sollte.

Kommentiert el 12 de Januar, 2011 von nukl

5 Stimmen

Reine Anfragen zum Schreiben von Code sind auf Stack Overflow tabu - wir erwarten, dass sich die Fragen hier auf spezifisch Programmierprobleme - aber wir helfen Ihnen gerne, sie selbst zu schreiben! Sagen Sie es uns was Sie ausprobiert haben und wo Sie feststecken. Dies wird uns auch helfen, Ihre Frage besser zu beantworten.

Kommentiert el 5 de Februar, 2016 von Cerbrus

Anzeigen 3 weitere Kommentare

Answer 1

5 Antworten

Answer 2

25voto

Chinmay Kanchi Punkte 58341

Sie können verwenden re.finditer() für sich nicht überschneidende Treffer.

>>> import re
>>> aString = 'this is a string where the substring "is" is repeated several times'
>>> print [(a.start(), a.end()) for a in list(re.finditer('is', aString))]
[(2, 4), (5, 7), (38, 40), (42, 44)]

sondern wird nicht arbeiten für:

In [1]: aString="ababa"

In [2]: print [(a.start(), a.end()) for a in list(re.finditer('aba', aString))]
Output: [(0, 3)]

Beantwortet el 12 de Januar, 2011 von Chinmay Kanchi (58341 Punkte )

Answer 3

22voto

Cody Piersall Punkte 7794

Komm, lass uns gemeinsam nachdenken.

def locations_of_substring(string, substring):
    """Return a list of locations of a substring."""

    substring_length = len(substring)    
    def recurse(locations_found, start):
        location = string.find(substring, start)
        if location != -1:
            return recurse(locations_found + [location], location+substring_length)
        else:
            return locations_found

    return recurse([], 0)

print(locations_of_substring('this is a test for finding this and this', 'this'))
# prints [0, 27, 36]

Auf diese Weise sind keine regulären Ausdrücke erforderlich.

Beantwortet el 1 de November, 2013 von Cody Piersall (7794 Punkte )

Answer 4

13voto

jstaab Punkte 2763

Wenn Sie nur ein einzelnes Zeichen suchen, würde dies funktionieren:

string = "dooobiedoobiedoobie"
match = 'o'
reduce(lambda count, char: count + 1 if char == match else count, string, 0)
# produces 7

Auch,

string = "test test test test"
match = "test"
len(string.split(match)) - 1
# produces 4

Meine Vermutung ist, dass keine von beiden (insbesondere Nr. 2) besonders leistungsfähig ist.

Beantwortet el 24 de September, 2014 von jstaab (2763 Punkte )

Answer 5

12voto

Thurines Punkte 101

Dies ist ein altes Thema, aber ich habe mich dafür interessiert und wollte meine Lösung mitteilen.

def find_all(a_string, sub):
    result = []
    k = 0
    while k < len(a_string):
        k = a_string.find(sub, k)
        if k == -1:
            return result
        else:
            result.append(k)
            k += 1 #change to k += len(sub) to not search overlapping results
    return result

Sie sollte eine Liste der Positionen zurückgeben, an denen die Teilzeichenkette gefunden wurde. Bitte kommentieren Sie, wenn Sie einen Fehler oder Raum für Verbesserungen sehen.

Beantwortet el 1 de April, 2015 von Thurines (101 Punkte )

Answer 6

9voto

Bruno Vermeulen Punkte 2617

So funktioniert es bei mir mit re.finditer

import re

text = 'This is sample text to test if this pythonic '\
       'program can serve as an indexing platform for '\
       'finding words in a paragraph. It can give '\
       'values as to where the word is located with the '\
       'different examples as stated'

#  find all occurances of the word 'as' in the above text

find_the_word = re.finditer('as', text)

for match in find_the_word:
    print('start {}, end {}, search string \'{}\''.
          format(match.start(), match.end(), match.group()))

Beantwortet el 6 de Juli, 2018 von Bruno Vermeulen (2617 Punkte )

Wie findet man alle Vorkommen einer Teilzeichenkette?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie findet man alle Vorkommen einer Teilzeichenkette?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: