Wie kann ich doppelte Zeilen entfernen?

Question

Wie kann ich doppelte Zeilen entfernen?

Gefragt el 20 de August, 2008: Wann wurde die Frage gestellt
1320048 Ansichten: Anzahl der Besuche der Frage
5 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Wie entfernt man am besten doppelte Zeilen aus einer ziemlich großen SQL Server Tabelle (d.h. 300.000+ Zeilen)?

Die Zeilen werden natürlich keine perfekten Duplikate sein, da es die RowID Identitätsfeld.

MyTable

RowID int not null identity(1,1) primary key,
Col1 varchar(20) not null,
Col2 varchar(2048) not null,
Col3 tinyint not null

Gefragt el 20 de August, 2008 von Seibar

15 Stimmen

Kleiner Tipp für PostgreSQL-Benutzer, die dies lesen (viele, wenn man bedenkt, wie oft es verlinkt wird): Pg stellt CTE-Terme nicht als aktualisierbare Views zur Verfügung, so dass Sie nicht DELETE FROM ein CTE-Begriff direkt. Siehe stackoverflow.com/q/18439054/398670

Kommentiert el 26 de August, 2013 von Craig Ringer

0 Stimmen

@CraigRinger das gleiche gilt für Sybase - Die übrigen Lösungen habe ich hier zusammengestellt (sollten auch für PG und andere gelten): stackoverflow.com/q/19544489/1855801 (ersetzen Sie einfach die ROWID() Funktion durch die Spalte RowID, falls vorhanden)

Kommentiert el 29 de Oktober, 2013 von maf-soft

14 Stimmen

Ich möchte hier nur einen Vorbehalt anbringen. Wenn Sie einen Deduplizierungsprozess durchführen, überprüfen Sie immer zuerst, was Sie löschen! Dies ist einer der Bereiche, in denen es sehr häufig vorkommt, dass versehentlich gute Daten gelöscht werden.

Kommentiert el 4 de Dezember, 2013 von Jeff Davis

Answer 1

5 Antworten

Answer 2

47voto

Jithin Shaji Punkte 5453

DELETE LU 
FROM   (SELECT *, 
               Row_number() 
                 OVER ( 
                   partition BY col1, col1, col3 
                   ORDER BY rowid DESC) [Row] 
        FROM   mytable) LU 
WHERE  [row] > 1

Beantwortet el 21 de Kann, 2014 von Jithin Shaji (5453 Punkte )

1 Stimmen

Ich erhalte diese Meldung auf Azure SQL DW: Eine FROM-Klausel wird derzeit in einer DELETE-Anweisung nicht unterstützt.

Kommentiert el 22 de Oktober, 2016 von Amit

Answer 3

42voto

Syed Mohamed Punkte 1301

Dadurch werden doppelte Zeilen gelöscht, außer der ersten Zeile.

DELETE
FROM
    Mytable
WHERE
    RowID NOT IN (
        SELECT
            MIN(RowID)
        FROM
            Mytable
        GROUP BY
            Col1,
            Col2,
            Col3
    )

Siehe ( http://www.codeproject.com/Articles/157977/Remove-Duplicate-Rows-from-a-Table-in-SQL-Server )

Beantwortet el 10 de September, 2013 von Syed Mohamed (1301 Punkte )

11 Stimmen

Bei mysql wird ein Fehler angezeigt: Fehlercode: 1093. Sie können die Zieltabelle 'Mytable' für die Aktualisierung in der FROM-Klausel nicht angeben, aber diese kleine Änderung wird für mysql funktionieren: DELETE FROM Mytable WHERE RowID NOT IN ( SELECT ID FROM (SELECT MIN(RowID) AS ID FROM Mytable GROUP BY Col1,Col2,Col3) AS TEMP)

Kommentiert el 29 de Februar, 2016 von Ritesh

Answer 4

37voto

Shamseer K Punkte 4434

Ich würde CTE für das Löschen von doppelten Zeilen aus Sql Server Tabelle bevorzugen

empfehlen wir dringend, diesen Artikel zu lesen:: http://codaffection.com/sql-server-article/delete-duplicate-rows-in-sql-server/

durch Beibehaltung der ursprünglichen

WITH CTE AS
(
SELECT *,ROW_NUMBER() OVER (PARTITION BY col1,col2,col3 ORDER BY col1,col2,col3) AS RN
FROM MyTable
)

DELETE FROM CTE WHERE RN<>1

ohne das Original zu behalten

WITH CTE AS
(SELECT *,R=RANK() OVER (ORDER BY col1,col2,col3)
FROM MyTable)
 
DELETE CTE
WHERE R IN (SELECT R FROM CTE GROUP BY R HAVING COUNT(*)>1)

Beantwortet el 19 de Kann, 2015 von Shamseer K (4434 Punkte )

0 Stimmen

In einer Abfrage verwenden Sie 'from' nach dem Löschen und in einer anderen ist 'from' nicht vorhanden, was ist das, ich bin verwirrt?

Kommentiert el 3 de April, 2021 von user3065757

Answer 5

30voto

Shaini Sinha Punkte 487

Um doppelte Zeilen zu holen:

SELECT
name, email, COUNT(*)
FROM 
users
GROUP BY
name, email
HAVING COUNT(*) > 1

So löschen Sie die doppelten Zeilen:

DELETE users 
WHERE rowid NOT IN 
(SELECT MIN(rowid)
FROM users
GROUP BY name, email);

Beantwortet el 29 de Dezember, 2016 von Shaini Sinha (487 Punkte )

0 Stimmen

Für MySQL-Benutzer ist zu beachten, dass es sich zunächst um eine DELETE FROM Zweitens: Es wird nicht funktionieren, weil man nicht SELECT aus derselben Tabelle, die Sie DELETE aus. In MySQL sprengt das die MySQL error 1093 .

Kommentiert el 9 de August, 2019 von Íhor Mé

0 Stimmen

Ich denke, das ist viel vernünftiger als die eher esotherisch anmutende Antwort mit DELETE FROM ... LEFT OUTER JOIN die auch auf einigen Systemen (z. B. SQL Server) nicht funktioniert. Wenn Sie auf die oben genannte Einschränkung stoßen, können Sie die Ergebnisse Ihrer Auswahl immer in einer temporären TABLE-Variablen speichern: DECLARE @idsToKeep TABLE(rowid INT); y luego INSERT INTO @idsToKeep(rowid) SELECT MIN... GROUP BY ... しかるのち DELETE users WHERE rowid NOT IN (SELECT rowid FROM @idsToKeep);

Kommentiert el 15 de August, 2021 von Oliver Schimmer

Answer 6

24voto

JuanJo Punkte 265

Quick and Dirty, um exakt duplizierte Zeilen zu löschen (für kleine Tabellen):

select  distinct * into t2 from t1;
delete from t1;
insert into t1 select *  from t2;
drop table t2;

Beantwortet el 5 de Februar, 2013 von JuanJo (265 Punkte )

3 Stimmen

Beachten Sie, dass die Frage eigentlich eine nicht exakte Vervielfältigung (dueto row id) vorsieht.

Kommentiert el 16 de Juli, 2015 von Dennis Jaheruddin

0 Stimmen

Sie müssen auch mit Identitätsspalten (Schlüssel) umgehen, indem Sie set identity_insert t1 on .

Kommentiert el 28 de August, 2020 von David R Tribble

Wie kann ich doppelte Zeilen entfernen?

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Wie kann ich doppelte Zeilen entfernen?

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: