Entfernen Sie leere Zeichenfolgen aus einer Liste von Zeichenfolgen

Question

Entfernen Sie leere Zeichenfolgen aus einer Liste von Zeichenfolgen

Gefragt el 2 de Oktober, 2010: Wann wurde die Frage gestellt
948042 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich möchte alle leeren Strings aus einer Liste von Strings in Python entfernen.

Meine Idee sieht so aus:

while '' in str_list:
    str_list.remove('')

Gibt es einen pythonischeren Weg, um dies zu tun?

Gefragt el 2 de Oktober, 2010 von zerodx

50 Stimmen

@Ivo, keiner dieser Aussagen ist wahr. Sie sollten niemals eine Liste ändern, über die Sie iterieren, indem Sie for x in list verwenden. Wenn Sie eine while-Schleife verwenden, ist es in Ordnung. Die demonstrierte Schleife entfernt leere Zeichenfolgen, bis keine leeren Zeichenfolgen mehr vorhanden sind, und stoppt dann. Ich hatte mir tatsächlich nicht einmal die Frage angesehen (nur den Titel), aber ich habe mit genau derselben Schleife als Möglichkeit geantwortet! Wenn Sie keine Verständniskomprehensionen oder Filter verwenden möchten, um Speicherplatz zu sparen, ist dies eine sehr pythonische Lösung.

Kommentiert el 2 de Oktober, 2010 von aaronasterling

4 Stimmen

Noch ein sehr gültiger Punkt, die Liste, über die Sie iterieren, niemals zu ändern :)

Kommentiert el 12 de Februar, 2016 von Eduard Luca

1 Stimmen

@EduardLuca, wenn der Zweck des Iterierens über eine Liste darin besteht, sie zu ändern, dann ist das genau das Gegenteil von dem, was du tun solltest. Du musst nur darauf achten, dass du dabei kein unerwartetes Verhalten verursachst.

Kommentiert el 1 de April, 2016 von Jacqlyn

Anzeigen 2 weitere Kommentare

Answer 1

5 Antworten

Answer 2

1549voto

livibetter Punkte 18322

Ich würde filter verwenden:

str_list = filter(None, str_list)
str_list = filter(bool, str_list)
str_list = filter(len, str_list)
str_list = filter(lambda item: item, str_list)

In Python 3 gibt filter einen Iterator zurück, daher sollte er in einem Aufruf von list() eingehüllt werden

str_list = list(filter(None, str_list))

Beantwortet el 2 de Oktober, 2010 von livibetter (18322 Punkte )

0 Stimmen

Vielleicht, aber timeit zeigt den Unterschied, und die Verwendung von None ist leserlicher und klarer - meiner Meinung nach! Oder ich würde sagen, die Verwendung von filter(None, l1) wird auf eine pythonische Weise aussehen.

Kommentiert el 2 de Oktober, 2010 von shahjapan

19 Stimmen

Wenn Sie so auf Leistung gedrängt sind, ist itertools's ifilter sogar schneller—>>> timeit('filter(None, str_list)', 'str_list=["a"]*1000', number=100000) 2.3468542098999023; >>> timeit('itertools.ifilter(None, str_list)', 'str_list=["a"]*1000', number=100000) 0.04442191123962402.

Kommentiert el 21 de Juli, 2011 von Humphrey Bogart

1 Stimmen

@BeauMartínez die Zeit für itertools.ifilter ist nicht vollständig genau, da der Generator noch nicht ausgewertet wurde. Es sollte mit list() umschlossen werden. filter(bool) -> 1.367577075958252, ifilter(bool) -> 0.032318115234375, list(ifilter(bool)) -> 1.8174781799316406

Kommentiert el 24 de August, 2012 von Uyghur Lives Matter

Anzeigen 10 weitere Kommentare

Answer 3

438voto

Ib33X Punkte 5954

Die Verwendung eines Listen-Verständnisses ist der Pythonischste Weg:

>>> strings = ["first", "", "second"]
>>> [x for x in strings if x]
['first', 'second']

Wenn die Liste direkt geändert werden muss, weil es andere Referenzen gibt, die die aktualisierten Daten sehen müssen, dann verwenden Sie eine Slice-Zuweisung:

strings[:] = [x for x in strings if x]

Beantwortet el 2 de Oktober, 2010 von Ib33X (5954 Punkte )

42 Stimmen

Ich mag diese Lösung, weil sie leicht anpassbar ist. Wenn ich nicht nur leere Zeichenfolgen, sondern auch Zeichenfolgen entfernen müsste, die nur Leerzeichen sind, zum Beispiel: [x für x in Zeichenfolgen, wenn x.strip()].

Kommentiert el 29 de Dezember, 2015 von Bond

1 Stimmen

[x für x in strings if x] Das funktioniert gut, aber können Sie bitte erklären, wie diese Schleife funktioniert??

Kommentiert el 31 de Januar, 2021 von Amar Kumar

8 Stimmen

@AmarKumar In Python wird ein leerer String in einem booleschen Kontext wie in if x zu false ausgewertet. Die Klammern, die for-Schleife und die if-Klausel kombinieren, um "eine Liste zu generieren, die aus x für jedes Element in strings besteht, wenn x tatsächlich etwas enthält." @Ib33x Absolut fantastische Arbeit. Diese Antwort ist sicherlich die Pythonischste.

Kommentiert el 22 de Februar, 2021 von Nat Riddle

Anzeigen 2 weitere Kommentare

Answer 4

110voto

Ivo van der Wijk Punkte 15553

Der Filter hat tatsächlich eine spezielle Option dafür:

filter(None, sequence)

Er wird alle Elemente filtern, die zu False ausgewertet werden. Es ist nicht nötig, hier einen tatsächlichen Aufruf wie bool, len und so weiter zu verwenden.

Es ist genauso schnell wie map(bool, ...)

Beantwortet el 2 de Oktober, 2010 von Ivo van der Wijk (15553 Punkte )

9 Stimmen

Dies ist tatsächlich ein Python-Idiom. Es ist auch die einzige Zeit, in der ich filter() noch verwende, Listenverständnisse haben überall sonst übernommen.

Kommentiert el 18 de Februar, 2014 von kaleissin

0 Stimmen

Ich finde es einfacher, die Absicht des Codes zu erkennen, im Vergleich zu einer Listenkomprehension.

Kommentiert el 17 de Dezember, 2020 von Martin CR

Answer 5

35voto

Aziz Alto Punkte 16611

>>> lstr = ['hello', '', ' ', 'world', ' ']
>>> lstr
['hello', '', ' ', 'world', ' ']

>>> ' '.join(lstr).split()
['hello', 'world']

>>> filter(None, lstr)
['hello', ' ', 'world', ' ']

Vergleiche Zeit

>>> from timeit import timeit
>>> timeit('" ".join(lstr).split()', "lstr=['hello', '', ' ', 'world', ' ']", number=10000000)
4.226747989654541
>>> timeit('filter(None, lstr)', "lstr=['hello', '', ' ', 'world', ' ']", number=10000000)
3.0278358459472656

Beachten Sie, dass filter(None, lstr) keine leeren Zeichenfolgen mit einem Leerzeichen ' ' entfernt, es entfernt nur '', während ' '.join(lstr).split() beide entfernt.

Um filter() mit Leerzeichenzeichenfolgen entfernt zu verwenden, dauert es viel länger:

>>> timeit('filter(None, [l.replace(" ", "") for l in lstr])', "lstr=['hello', '', ' ', 'world', ' ']", number=10000000)
18.101892948150635

Beantwortet el 26 de Oktober, 2015 von Aziz Alto (16611 Punkte )

0 Stimmen

Es wird nicht funktionieren, wenn Sie Leerzeichen innerhalb des Strings eines Wortes haben. zum Beispiel: ['hello world', ' ', 'hello', ' '] . >> ['helloworld', ' ', 'hello', ' '] haben Sie eine andere Lösung, um Leerzeichen innerhalb eines Elements in der Liste zu behalten, aber andere zu entfernen?

Kommentiert el 6 de Februar, 2018 von Reihan_amn

1 Stimmen

Beachten Sie, dass filter(None, lstr) keine leeren Zeichenfolgen mit einem Leerzeichen ' ' entfernt Das liegt daran, dass es sich nicht um eine leere Zeichenfolge handelt.

Kommentiert el 9 de Januar, 2020 von AMC

0 Stimmen

Lebensretter !!

Kommentiert el 2 de Januar, 2021 von Abu Shoeb

Answer 6

32voto

ankostis Punkte 7409

Fassen Sie die besten Antworten zusammen:

1. Entfernen von Leerelementen OHNE Entfernung:

D. h. alle Leerzeichen bleiben erhalten:

slist = list(filter(None, slist))

PROs:

einfachste;
schnellste (siehe Benchmarks unten).

2. Leerzeichen nach dem Entfernen eliminieren ...

2.a ... wenn Zeichenfolgen KEINE Leerzeichen zwischen den Wörtern enthalten:

slist = ' '.join(slist).split()

PROs:

kleiner Code
schnell (ABER nicht der schnellste bei großen Datensätzen aufgrund des Speichers, im Gegensatz zu den Ergebnissen von @paolo-melchiorre)

2.b ... wenn Zeichenfolgen Leerzeichen zwischen den Wörtern enthalten?

slist = list(filter(str.strip, slist))

PROs:

der schnellste;
Verständlichkeit des Codes.

Benchmarks auf einem Computer aus dem Jahr 2018:

## Testdaten erstellen
#
import random, string
nwords = 10000
maxlen = 30
null_ratio = 0.1
rnd = random.Random(0)                  # deterministische Ergebnisse
words = [' ' * rnd.randint(0, maxlen)
         if rnd.random() > (1 - null_ratio)
         else
         ''.join(random.choices(string.ascii_letters, k=rnd.randint(0, maxlen)))
         for _i in range(nwords)
        ]

## Testfunktionen
#
def nostrip_filter(slist):
    return list(filter(None, slist))

def nostrip_comprehension(slist):
    return [s for s in slist if s]

def strip_filter(slist):
    return list(filter(str.strip, slist))

def strip_filter_map(slist): 
    return list(filter(None, map(str.strip, slist))) 

def strip_filter_comprehension(slist):  # verschwendet Speicher
    return list(filter(None, [s.strip() for s in slist]))

def strip_filter_generator(slist):
    return list(filter(None, (s.strip() for s in slist)))

def strip_join_split(slist):  # Wörter ohne(!) Leerzeichen
    return ' '.join(slist).split()

## Benchmarks
#
%timeit nostrip_filter(words)
142 µs ± 16.8 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 10000 Schleifen je Durchlauf)

%timeit nostrip_comprehension(words)
263 µs ± 19.1 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

%timeit strip_filter(words)
653 µs ± 37.5 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

%timeit strip_filter_map(words)
642 µs ± 36 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

%timeit strip_filter_comprehension(words)
693 µs ± 42.2 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

%timeit strip_filter_generator(words)
750 µs ± 28.6 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

%timeit strip_join_split(words)
796 µs ± 103 µs pro Schleife (Mittelwert ± Standardabweichung von 7 Durchläufen, 1000 Schleifen je Durchlauf)

Beantwortet el 15 de September, 2017 von ankostis (7409 Punkte )

0 Stimmen

s und s.strip() können einfach zu s.strip() vereinfacht werden.

Kommentiert el 9 de Januar, 2020 von AMC

0 Stimmen

s und s.strip() sind notwendig, wenn wir filter(None, words), die akzeptierte Antwort, vollständig replizieren wollen. Ich habe die beiden Beispielfunktionen oben korrigiert und die beiden schlechten weggelassen.

Kommentiert el 10 de Januar, 2020 von ankostis

Entfernen Sie leere Zeichenfolgen aus einer Liste von Zeichenfolgen

Antworten

Fassen Sie die besten Antworten zusammen:

1. Entfernen von Leerelementen OHNE Entfernung:

2. Leerzeichen nach dem Entfernen eliminieren ...

2.a ... wenn Zeichenfolgen KEINE Leerzeichen zwischen den Wörtern enthalten:

2.b ... wenn Zeichenfolgen Leerzeichen zwischen den Wörtern enthalten?

Benchmarks auf einem Computer aus dem Jahr 2018:

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Entfernen Sie leere Zeichenfolgen aus einer Liste von Zeichenfolgen

Antworten

Fassen Sie die besten Antworten zusammen:

1. Entfernen von Leerelementen OHNE Entfernung:

2. Leerzeichen nach dem Entfernen eliminieren ...

2.a ... wenn Zeichenfolgen KEINE Leerzeichen zwischen den Wörtern enthalten:

2.b ... wenn Zeichenfolgen Leerzeichen zwischen den Wörtern enthalten?

Benchmarks auf einem Computer aus dem Jahr 2018:

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: