Wie finde ich die Duplikate in einer Liste und erstelle eine weitere Liste mit ihnen?

Question

Wie finde ich die Duplikate in einer Liste und erstelle eine weitere Liste mit ihnen?

Gefragt el 23 de Marsch, 2012: Wann wurde die Frage gestellt
1235308 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Wie finde ich die Duplikate in einer Liste mit ganzen Zahlen und erstelle eine weitere Liste mit den Duplikaten?

Gefragt el 23 de Marsch, 2012 von MFB

2 Stimmen

Mögliche Duplikate von Wie entfernt man Duplikate aus einer Liste in Python unter Beibehaltung der Reihenfolge?

Kommentiert el 23 de Marsch, 2012 von DhruvPathak

3 Stimmen

Wollen Sie die Duplikate einmalig oder jedes Mal, wenn sie wieder gesehen werden?

Kommentiert el 23 de Marsch, 2012 von moooeeeep

0 Stimmen

Ich denke, diese Frage wurde hier bereits sehr viel effizienter beantwortet. stackoverflow.com/a/642919/1748045 Schnittpunkt ist eine eingebaute Methode von set und sollte genau das tun, was erforderlich ist

Kommentiert el 7 de Oktober, 2014 von Tom Smith

Answer 1

5 Antworten

Answer 2

2voto

Baris Ozensel Punkte 358

Eine andere Lösung ist die folgende, ohne eine Sammlungsbibliothek zu verwenden.

a = [1,2,3,5,4,6,4,21,4,6,3,32,5,2,23,5]
duplicates = []

for i in a:
    if a.count(i) > 1 and i not in duplicates:
        duplicates.append(i)

print(duplicates)

Die Ausgabe lautet [2, 3, 5, 4, 6]

Beantwortet el 10 de April, 2022 von Baris Ozensel (358 Punkte )

Answer 3

2voto

sergzach Punkte 6232

Einige andere Tests. Natürlich zu tun...

set([x for x in l if l.count(x) > 1])

...ist zu kostspielig. Es ist etwa 500 Mal schneller (je länger das Array ist, desto besser sind die Ergebnisse), die nächste letzte Methode zu verwenden:

def dups_count_dict(l):
    d = {}

    for item in l:
        if item not in d:
            d[item] = 0

        d[item] += 1

    result_d = {key: val for key, val in d.iteritems() if val > 1}

    return result_d.keys()

Nur 2 Schleifen, nicht sehr kostspielig l.count() Operationen.

Hier ist ein Code zum Vergleich der Methoden als Beispiel. Der Code ist unten, hier ist die Ausgabe:

dups_count: 13.368s # this is a function which uses l.count()
dups_count_dict: 0.014s # this is a final best function (of the 3 functions)
dups_count_counter: 0.024s # collections.Counter

Der Prüfcode:

import numpy as np
from time import time
from collections import Counter

class TimerCounter(object):
    def __init__(self):
        self._time_sum = 0

    def start(self):
        self.time = time()

    def stop(self):
        self._time_sum += time() - self.time

    def get_time_sum(self):
        return self._time_sum

def dups_count(l):
    return set([x for x in l if l.count(x) > 1])

def dups_count_dict(l):
    d = {}

    for item in l:
        if item not in d:
            d[item] = 0

        d[item] += 1

    result_d = {key: val for key, val in d.iteritems() if val > 1}

    return result_d.keys()

def dups_counter(l):
    counter = Counter(l)    

    result_d = {key: val for key, val in counter.iteritems() if val > 1}

    return result_d.keys()

def gen_array():
    np.random.seed(17)
    return list(np.random.randint(0, 5000, 10000))

def assert_equal_results(*results):
    primary_result = results[0]
    other_results = results[1:]

    for other_result in other_results:
        assert set(primary_result) == set(other_result) and len(primary_result) == len(other_result)

if __name__ == '__main__':
    dups_count_time = TimerCounter()
    dups_count_dict_time = TimerCounter()
    dups_count_counter = TimerCounter()

    l = gen_array()

    for i in range(3):
        dups_count_time.start()
        result1 = dups_count(l)
        dups_count_time.stop()

        dups_count_dict_time.start()
        result2 = dups_count_dict(l)
        dups_count_dict_time.stop()

        dups_count_counter.start()
        result3 = dups_counter(l)
        dups_count_counter.stop()

        assert_equal_results(result1, result2, result3)

    print 'dups_count: %.3f' % dups_count_time.get_time_sum()
    print 'dups_count_dict: %.3f' % dups_count_dict_time.get_time_sum()
    print 'dups_count_counter: %.3f' % dups_count_counter.get_time_sum()

Beantwortet el 1 de Juni, 2018 von sergzach (6232 Punkte )

Answer 4

2voto

All Іѕ Vаиітy Punkte 22253

raw_list = [1,2,3,3,4,5,6,6,7,2,3,4,2,3,4,1,3,4,]

clean_list = list(set(raw_list))
duplicated_items = []

for item in raw_list:
    try:
        clean_list.remove(item)
    except ValueError:
        duplicated_items.append(item)

print(duplicated_items)
# [3, 6, 2, 3, 4, 2, 3, 4, 1, 3, 4]

Sie entfernen Duplikate grundsätzlich durch Konvertierung in Set ( clean_list ), dann iterieren Sie die raw_list und gleichzeitig die einzelnen item in der bereinigten Liste für das Vorkommen in raw_list . Wenn item nicht gefunden wird, wird die erhöhte ValueError Ausnahme wird abgefangen und die item wird hinzugefügt zu duplicated_items Liste.

Wenn der Index der duplizierten Elemente benötigt wird, genügt es enumerate die Liste und spielen Sie mit dem Index herum. ( for index, item in enumerate(raw_list): ), das schneller ist und für große Listen (mit mehr als tausend Elementen) optimiert wurde.

Beantwortet el 14 de Marsch, 2019 von All Іѕ Vаиітy (22253 Punkte )

Answer 5

2voto

Ravikiran D Punkte 319

Verwendung von list.count() Methode in der Liste, um die doppelten Elemente einer gegebenen Liste herauszufinden

arr=[]
dup =[]
for i in range(int(input("Enter range of list: "))):
    arr.append(int(input("Enter Element in a list: ")))
for i in arr:
    if arr.count(i)>1 and i not in dup:
        dup.append(i)
print(dup)

Beantwortet el 11 de Kann, 2019 von Ravikiran D (319 Punkte )

0 Stimmen

Einfaches Auffinden doppelter Elemente in einer Liste mit der Funktion count

Kommentiert el 11 de Kann, 2019 von Ravikiran D

Answer 6

2voto

Wizr Punkte 131

Einzeiler, nur so zum Spaß, und wenn eine einzige Aussage erforderlich ist.

(lambda iterable: reduce(lambda (uniq, dup), item: (uniq, dup | {item}) if item in uniq else (uniq | {item}, dup), iterable, (set(), set())))(some_iterable)

Beantwortet el 6 de September, 2019 von Wizr (131 Punkte )

Wie finde ich die Duplikate in einer Liste und erstelle eine weitere Liste mit ihnen?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie finde ich die Duplikate in einer Liste und erstelle eine weitere Liste mit ihnen?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: