最近项目中遇到了一个需求,即“如何删除表中重复记录,使得所有重复的记录都只保留一行?”。在Google了半个小时之后,发现居然没有一个是正常可用的,于是乎只好自己动手写了一个。因为即便是Grails提供了很好的GORM,但是使用SQL仍然不可能完全避免,因此把它共享出来,也符合咱们网站的“共享开发经验”的宗旨。
具体的分析就不多说了,这里面主要是SQL的功夫,在此就直接列出解法,实验是在MySQL上做的,实验用的表结构是(id, first_name, last_name, parent)。
基础语句,列出重复记录:
select *
from db1.person
group by first_name,last_name,parent
having count(*)>1
第一种做法,使用not in:
delete from db1.person where id not in (
select id
from(
(select max(id) id
from db1.person
group by first_name, last_name, parent
having count(id)>1)
union
(select id
from db1.person
group by first_name, last_name, parent
having count(id)=1)
) temp
)
上面的语句的意思应该非常直白了,简直就是大白话。可问题是not in的效率并不是特别高,因此这就有了第二种解法,使用外联结+is null + exists:
delete from db1.person where exists(
select * from
(
select a.id aid, b.id bid
from db1.person a left outer join
((select max(id) id
from db1.person
group by first_name, last_name, parent
having count(id)>1)
union
(select id
from db1.person
group by first_name, last_name, parent
having count(id)=1)) b on a.id= b.id
) tmp
where aid= id and bid is null
)
对于有主键或有唯一性约束的表,以上解法应该足够了。但有时候如果没有主键怎么办,虽然这一点似乎有点不可思议,但实际总会遇到,尤其在表不是你设计的时候。这时,只好采用一个稍微有点“恶趣味”的做法:把distinct的结果放到另一张表中,drop掉原来的表,再把那张表重命名:
create table newperson select distinct * from person;
drop table db1.person;
ALTER TABLE `db1`.`newperson` RENAME TO `db1`.`person`;
以上就是基本的解决方案,但在实际中可能情况比较复杂,尤其是在有外键关联的时候,可能就有些问题了。但话说回来,既然决定要“删除”记录,那么在作出这个决策的时候,应该就已经考虑过外键的情形了吧;)
转载于
http://www.groovyq.net/node/162
分享到:
相关推荐
这种方法适用于仅需删除重复记录中的部分行,而保留至少一行的情况。通过比较不同记录的ROWID来确定哪些记录是重复的,并利用子查询找出这些重复记录的最大ROWID,然后将其删除。 **SQL示例代码:** ```sql DELETE...
当表中的某个字段(id)是唯一主键时,可以使用以下语句删除重复记录: ```sql DELETE FROM table WHERE id NOT IN ( SELECT MAX(id) FROM table GROUP BY col1, col2, ...,coln ) ``` 其中`col1, col2, ..., ...
这种方法通过创建两个临时表来辅助删除重复记录的过程。首先,通过`GROUP BY`和`COUNT(*)`函数找出重复的记录,并将这些记录的ID存储到临时表`temp1`中。接着,将不重复的记录也插入到`temp1`中。之后,创建一个新的...
删除重复记录的核心思想是先识别出哪些记录是重复的,然后通过某种方式将这些重复记录从数据表中移除。通常的做法包括: 1. **识别重复记录**:通过`GROUP BY`和`HAVING`子句找出具有相同字段值的记录。 2. **标记...
2. **删除表中多余的重复记录** - **删除单字段重复记录(保留最小ROWID)** ```sql DELETE FROM people WHERE peopleId IN ( SELECT peopleId FROM people GROUP BY peopleId HAVING COUNT(peopleId) > 1 ...
这就是使用临时表来删除重复记录。我们可以创建一个临时表,具有相同的结构,然后将数据从原表中拷贝到临时表中。最后,我们可以删除原表中的数据,并将临时表中的数据导入原表中。 结论 删除数据库中重复记录是...
重复数据的存在不仅会占用额外的存储空间,还可能导致数据统计错误、数据分析偏差等问题,因此,有效地删除表中的重复数据是保持数据质量和提高数据库性能的重要环节。本文将详细解析如何在Oracle中删除表中的重复...
以下是如何使用SQL语句来删除数据表中重复记录的详细步骤。 首先,我们来看一个简单的例子,假设我们有一个名为`Repeat`的数据表,其中存在重复的记录。要删除这些重复的记录,但保留每个唯一组合的最新(最大`id`...
这种方法不需要创建临时表,而是直接通过子查询的方式删除重复记录。 1. **确定唯一标识字段**: 首先需要确定哪些字段组合起来可以作为一条记录的唯一标识,比如主键或一组具有唯一性的字段。 2. **删除重复记录...
以下是一个简单的示例代码片段,展示了如何在 Delphi 中删除重复记录: ```delphi uses ADODB; procedure RemoveDuplicates(ADataset: TDataSet); var CurrentRecord, LastRecord: Variant; begin // 先移动到...
这种方法适用于只需要删除重复记录中的某些行的情况。步骤如下: 1. **找出重复的记录**:首先,我们需要找到那些重复的记录。可以通过子查询来实现这一点。 ```sql SELECT age FROM ( SELECT age, COUNT(*) as...
在开始删除重复记录之前,首先需要确定哪些记录是重复的。以下SQL语句可以用来查询`test`表中所有字段都重复的记录: ```sql SELECT * FROM test GROUP BY name, age, sex, id, sf HAVING COUNT(*) > 1; ``` 这里...
在Access中一般只能查找10行大概20条重复记录,这样程序就可以任意指定表及多字段检索重复记录,并把重复的记录移除到一个临时表中,并不是进行真正删除,你可以进行恢复。但是执行第二次查找时则自动删除上次查找的...
在数据库管理中,删除重复记录是一个非常重要的操作。重复记录可能来自于数据导入、系统错误或者其他原因。今天,我们将探讨如何使用 SQL 语句删除重复记录。下面将介绍四种不同的方法来删除重复记录。 Knowledge ...
在Access中一般只能查找10行大概20条重复记录,这样程序就可以任意指定表及多字段检索重复记录,并把重复的记录移除到一个临时表中,并不是进行真正删除,你可以进行恢复。但是执行第二次查找时则自动删除上次查找的...
上述命令会在删除重复记录的同时,将异常记录存储到`exceptions`表中,便于后续分析和处理。 通过上述方法,我们可以有效地在Oracle数据库中查找和删除重复记录。选择哪种方法取决于具体的业务场景和技术需求。...
本篇文章将深入探讨如何在SQL数据库,如Microsoft Access(.accdb)中查找并删除重复记录。 一、查找重复记录 1. SQL查询:使用`GROUP BY`和`HAVING`子句可以找出重复的数据。例如,假设我们有一个`Employees`表,...
SQL Server 中删除具有相同 `servid` 的重复记录 **示例**: ```sql DELETE FROM t_serviceitem WHERE servid IN (SELECT servid FROM t_serviceitem GROUP BY servid HAVING COUNT(servid) > 1) AND gid NOT IN ...