MS-SQL删除数据库中的重复行

最新推荐文章于 2025-01-07 07:19:52 发布

转载最新推荐文章于 2025-01-07 07:19:52 发布 · 1.1k 阅读

标签

#数据库 #insert #delete

数据库专栏收录该内容

7 篇文章

订阅专栏

本文介绍了一种高效处理数据库中重复主键数据的方法，包括如何通过GROUP BY查询识别重复项，将重复键和行分别存入临时表，验证唯一性并选择保留的数据，最终删除重复行并将唯一数据回填到原始表。

假如表中有多组完全不同的重复的 PK 值，则逐个删除它们会很费时间。在这种情况下，可使用下面的方法：
1.首先，运行上面的 GROUP BY 查询来确定有多少组重复的 PK 值及每组的重复数。
2.选择重复的键值放入临时表中。例如：
SELECT　col1，　col2，　col3=count
INTO　holdkey
FROM　t1
GROUP　BY　col1，　col2
HAVING　count　　1
3.选择重复的行放入临时表中，以清除进程中的重复值。例如：
SELECT　DISTINCT　t1.
INTO　holddups
FROM　t1，　holdkey
WHERE　t1.col1　=　holdkey.col1
AND　t1.col2　=　holdkey.col2
4.此时，holddups 表应有唯一的 PK;但是，假如 t1 有重复的 PK 而行唯一，情况就不是这样了。请验证 holddups 中的各个键是否唯一，是否没有键重复而行唯一的情况。假如是这样，您必须停在该处，确定对于给定重复的键值，您希望保留哪些行。例如，以下查询：
SELECT　col1，　col2，　count
FROM　holddups
GROUP　BY　col1，　col2
应为各行返回计数 1。假如结果是 1，请继续执行下面的步骤 5。假如不是 1，则存在键重复而行唯一的情况，且需要您决定要保存哪些行。通常，这将需要舍弃行或为此行创建新的唯一的键值。为 holddups 表中每个此种重复 PK 执行这两个步骤之一。
5.从原始表中删除重复的行。例如：
DELETE　t1
FROM　t1，　holdkey
WHERE　t1.col1　=　holdkey.col1
AND　t1.col2　=　holdkey.col2
6.将唯一行放回原始表中。例如：
INSERT　t1　SELECT　　FROM　holddu