Verflachen einer flachen Liste in Python

Question

Verflachen einer flachen Liste in Python

Gefragt el 2 de Januar, 2009: Wann wurde die Frage gestellt
202106 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Diese Frage hat bereits Antworten:

Wie kann man aus einer Liste von Listen eine flache Liste machen? (28 Antworten )

Gibt es eine einfache Möglichkeit, eine Liste von iterables mit einer Liste Verständnis zu glätten, oder in Ermangelung dessen, was würden Sie alle betrachten, um den besten Weg zu glätten eine flache Liste wie diese, Ausgleich Leistung und Lesbarkeit?

Ich habe versucht, eine solche Liste mit einem verschachtelten Listenverständnis zu glätten, etwa so:

[image for image in menuitem for menuitem in list_of_menuitems]

Aber ich gerate in Schwierigkeiten durch die NameError Vielfalt dort, weil die name 'menuitem' is not defined . Nachdem ich gegoogelt und mich auf Stack Overflow umgesehen hatte, erhielt ich die gewünschten Ergebnisse mit einem reduce Erklärung:

reduce(list.__add__, map(lambda x: list(x), list_of_menuitems))

Aber diese Methode ist ziemlich unleserlich, denn ich brauche die list(x) Aufruf dort, weil x ein Django ist QuerySet Objekt.

Schlussfolgerung :

Vielen Dank an alle, die zu dieser Frage beigetragen haben. Hier ist eine Zusammenfassung von dem, was ich gelernt habe. Ich mache dies auch zu einem Gemeinschafts-Wiki, falls andere diese Beobachtungen ergänzen oder korrigieren möchten.

Meine ursprüngliche Aussage zur Reduzierung ist redundant und sollte besser so formuliert werden:

>>> reduce(list.__add__, (list(mi) for mi in list_of_menuitems))

Dies ist die korrekte Syntax für ein verschachteltes Listenverständnis (Brillante Zusammenfassung dF !):

>>> [image for mi in list_of_menuitems for image in mi]

Aber keine dieser Methoden ist so effizient wie die Verwendung von itertools.chain :

>>> from itertools import chain
>>> list(chain(*list_of_menuitems))

Und wie @cdleary bemerkt, ist es wahrscheinlich besser, die Magie des Operators * zu vermeiden, indem man chain.from_iterable etwa so:

>>> chain = itertools.chain.from_iterable([[1,2],[3],[5,89],[],[6]])
>>> print(list(chain))
>>> [1, 2, 3, 5, 89, 6]

Gefragt el 2 de Januar, 2009 von prairiedogg

31 Stimmen

Ich verstehe nicht, warum alle map(lambda x: list(x), other) verwenden - ist das nicht gleichbedeutend mit map(list, other)? Das list builtin ist aufrufbar...

Kommentiert el 2 de Januar, 2009 von cdleary

0 Stimmen

Es ist gleichwertig. Glücklicherweise hat Prairie Dogg erkannt, dass dieser Code hässlich ist :)

Kommentiert el 2 de Januar, 2009 von recursive

0 Stimmen

Ach ja, ich sehe, dass Sie in Ihrer Antwort darauf hingewiesen haben, @recursive. Entschuldigung für die Redundanz! :-)

Kommentiert el 2 de Januar, 2009 von cdleary

Anzeigen 5 weitere Kommentare

Answer 1

5 Antworten

Answer 2

337voto

cdleary Punkte 66512

Wenn Sie nur über eine reduzierte Version der Datenstruktur iterieren wollen und keine indizierbare Sequenz benötigen, sollten Sie itertools.chain und Unternehmen .

>>> list_of_menuitems = [['image00', 'image01'], ['image10'], []]
>>> import itertools
>>> chain = itertools.chain(*list_of_menuitems)
>>> print(list(chain))
['image00', 'image01', 'image10']

Es funktioniert mit allem, was iterabel ist, was auch Djangos iterable einschließen sollte QuerySet s, die Sie anscheinend in Ihrer Frage verwenden.

Edita: Dies ist wahrscheinlich genauso gut wie ein reduce, weil reduce den gleichen Overhead hat, der beim Kopieren der Elemente in die Liste entsteht, die erweitert wird. chain entsteht dieser (gleiche) Overhead nur, wenn Sie list(chain) am Ende.

Meta-Edit: Eigentlich ist es weniger Aufwand als die in der Frage vorgeschlagene Lösung, weil Sie die temporären Listen, die Sie erstellen, wegwerfen, wenn Sie das Original mit dem temporären erweitern.

Edita: Als J.F. Sebastian sagt itertools.chain.from_iterable vermeidet das Auspacken und Sie sollten das nutzen, um zu vermeiden * Magie, sondern die timeit-App zeigt einen vernachlässigbaren Leistungsunterschied.

Beantwortet el 2 de Januar, 2009 von cdleary (66512 Punkte )

1 Stimmen

Eine explizite Schleife, die mit .extend Methode ist nach diesem Benchmark die schnellste Lösung

Kommentiert el 30 de April, 2014 von jfs

0 Stimmen

Ich hatte noch nichts von from_iterable gehört. Es ist hübscher als das *, wenn auch weniger pythonisch

Kommentiert el 30 de Marsch, 2016 von Jules G.M.

1 Stimmen

Es sollte auch hervorgehoben werden, dass from_iterable vermeidet das Auspacken und kann so Probleme vermeiden, wenn Sie viele (potenziell unbegrenzte) Elemente in der Iterable haben. Wenn die Iterable lang genug ist, geht Ihnen der Speicher aus.

Kommentiert el 27 de Februar, 2018 von skeggse

Answer 3

300voto

dF. Punkte 70587

Sie haben es fast geschafft! Die verschachtelte Listenauffassungen zu machen ist es, die for Anweisungen in der gleichen Reihenfolge, wie sie in normalen verschachtelten for Erklärungen.

Daher ist diese

for inner_list in outer_list:
    for item in inner_list:
        ...

entspricht

[... for inner_list in outer_list for item in inner_list]

Sie wollen also

[image for menuitem in list_of_menuitems for image in menuitem]

Beantwortet el 2 de Januar, 2009 von dF. (70587 Punkte )

46 Stimmen

+1, ich habe so oft nachgeschlagen und dies ist die einzige Antwort, die ich gesehen habe, in der die Reihenfolge explizit genannt wird... Vielleicht kann ich sie mir jetzt merken!

Kommentiert el 20 de Marsch, 2012 von Izkata

11 Stimmen

Ich wünschte, ich könnte noch einmal dafür stimmen, weil diese Denkweise das Verständnis von verschachtelten Listen viel einfacher macht.

Kommentiert el 17 de Juni, 2013 von Derek Litz

0 Stimmen

Wohingegen [... for item in inner_list for inner_list in outer_list] ein Python-Fehler ist: Es wiederholt nur [... for item in inner_list] auf den letzten Wert von inner_list, und zwar so oft wie len(outer_list). Nutzlos.

Kommentiert el 14 de September, 2013 von smci

Anzeigen 5 weitere Kommentare

Answer 4

134voto

cdleary Punkte 66512

@S.Lott : Du hast mich dazu inspiriert, eine timeit-App zu schreiben.

Ich dachte mir, dass es auch von der Anzahl der Partitionen (Anzahl der Iteratoren innerhalb der Containerliste) abhängen würde - in Ihrem Kommentar wurde nicht erwähnt, wie viele Partitionen es von den dreißig Elementen gab. In diesem Diagramm werden in jedem Durchlauf tausend Elemente mit einer unterschiedlichen Anzahl von Partitionen abgeflacht. Die Elemente sind gleichmäßig auf die Partitionen verteilt.

Flattening Comparison

Code (Python 2.6):

#!/usr/bin/env python2.6

"""Usage: %prog item_count"""

from __future__ import print_function

import collections
import itertools
import operator
from timeit import Timer
import sys

import matplotlib.pyplot as pyplot

def itertools_flatten(iter_lst):
    return list(itertools.chain(*iter_lst))

def itertools_iterable_flatten(iter_iter):
    return list(itertools.chain.from_iterable(iter_iter))

def reduce_flatten(iter_lst):
    return reduce(operator.add, map(list, iter_lst))

def reduce_lambda_flatten(iter_lst):
    return reduce(operator.add, map(lambda x: list(x), [i for i in iter_lst]))

def comprehension_flatten(iter_lst):
    return list(item for iter_ in iter_lst for item in iter_)

METHODS = ['itertools', 'itertools_iterable', 'reduce', 'reduce_lambda',
           'comprehension']

def _time_test_assert(iter_lst):
    """Make sure all methods produce an equivalent value.
    :raise AssertionError: On any non-equivalent value."""
    callables = (globals()[method + '_flatten'] for method in METHODS)
    results = [callable(iter_lst) for callable in callables]
    if not all(result == results[0] for result in results[1:]):
        raise AssertionError

def time_test(partition_count, item_count_per_partition, test_count=10000):
    """Run flatten methods on a list of :param:`partition_count` iterables.
    Normalize results over :param:`test_count` runs.
    :return: Mapping from method to (normalized) microseconds per pass.
    """
    iter_lst = [[dict()] * item_count_per_partition] * partition_count
    print('Partition count:    ', partition_count)
    print('Items per partition:', item_count_per_partition)
    _time_test_assert(iter_lst)
    test_str = 'flatten(%r)' % iter_lst
    result_by_method = {}
    for method in METHODS:
        setup_str = 'from test import %s_flatten as flatten' % method
        t = Timer(test_str, setup_str)
        per_pass = test_count * t.timeit(number=test_count) / test_count
        print('%20s: %.2f usec/pass' % (method, per_pass))
        result_by_method[method] = per_pass
    return result_by_method

if __name__ == '__main__':
    if len(sys.argv) != 2:
        raise ValueError('Need a number of items to flatten')
    item_count = int(sys.argv[1])
    partition_counts = []
    pass_times_by_method = collections.defaultdict(list)
    for partition_count in xrange(1, item_count):
        if item_count % partition_count != 0:
            continue
        items_per_partition = item_count / partition_count
        result_by_method = time_test(partition_count, items_per_partition)
        partition_counts.append(partition_count)
        for method, result in result_by_method.iteritems():
            pass_times_by_method[method].append(result)
    for method, pass_times in pass_times_by_method.iteritems():
        pyplot.plot(partition_counts, pass_times, label=method)
    pyplot.legend()
    pyplot.title('Flattening Comparison for %d Items' % item_count)
    pyplot.xlabel('Number of Partitions')
    pyplot.ylabel('Microseconds')
    pyplot.show()

Edita: Beschlossen, es zu einem Gemeinschafts-Wiki zu machen.

Nota: METHODS sollte wahrscheinlich mit einem Dekorator akkumuliert werden, aber ich denke, so ist es für die Leute einfacher zu lesen.

Beantwortet el 3 de Januar, 2009 von cdleary (66512 Punkte )

0 Stimmen

Versuchen Sie sum_flatten = lambda iter_lst: sum(map(list, iter_lst), [])

Kommentiert el 8 de Januar, 2009 von jfs

20 Stimmen

Oder einfach Summe(Liste, [])

Kommentiert el 1 de September, 2009 von hoju

0 Stimmen

@EnTerr vorgeschlagen reduce(operator.iadd stackoverflow.com/questions/3040335/ die bisher die schnellste ist (Code: ideone.com/NWThp Bild: i403.photobucket.com/albums/pp111/uber_ulrich/p1000.png )

Kommentiert el 16 de Juni, 2010 von jfs

Anzeigen 2 weitere Kommentare

Answer 5

56voto

Prem Anand Punkte 2269

sum(list_of_lists, []) würde es platt machen.

l = [['image00', 'image01'], ['image10'], []]
print sum(l,[]) # prints ['image00', 'image01', 'image10']

Beantwortet el 27 de Februar, 2014 von Prem Anand (2269 Punkte )

Answer 6

43voto

James Brady Punkte 22686

Diese Lösung funktioniert für beliebige Verschachtelungstiefen - nicht nur für die "Liste von Listen"-Tiefe, auf die einige (alle?) der anderen Lösungen beschränkt sind:

def flatten(x):
    result = []
    for el in x:
        if hasattr(el, "__iter__") and not isinstance(el, basestring):
            result.extend(flatten(el))
        else:
            result.append(el)
    return result

Es ist die Rekursion, die eine beliebige Verschachtelungstiefe ermöglicht - bis man natürlich die maximale Rekursionstiefe erreicht...

Beantwortet el 2 de Januar, 2009 von James Brady (22686 Punkte )

1 Stimmen

Ich habe so etwas bereits in itertools erwartet. Gibt es ähnliche Lösungen, die Comprehensions verwenden?

Kommentiert el 18 de Juni, 2012 von Josep Valls

3 Stimmen

Dies war für mich am nützlichsten, da es keine Zeichenketten trennt.

Kommentiert el 27 de Juni, 2013 von cdhagmann

1 Stimmen

@JosepVallsm schöne Lösung! für Python3 müssen Sie verwenden str anstelle von basestring , Der eingebaute abstrakte Typ basestring wurde entfernt. Verwenden Sie stattdessen str. Die Typen str und bytes haben nicht genug Funktionalität gemeinsam, um eine gemeinsame Basisklasse zu rechtfertigen. Das 2to3-Werkzeug (siehe unten) ersetzt jedes Vorkommen von basestring durch str.

Kommentiert el 12 de Januar, 2019 von Anu

Anzeigen 1 weitere Kommentare

Verflachen einer flachen Liste in Python

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Verflachen einer flachen Liste in Python

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: