`
aiyan2001
  • 浏览: 74017 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

删除表重复记录

阅读更多

在Oracle中利用Rowid查找和删除表中的重复记录

2010-06-12 15:15:18 来源:不详 作者: 点击: <script src="http://news.newhua.com/Click.asp?type=ajax&amp;SubSys=NS&amp;spanid=NS_id_click_996B5AI12JK0FG8GEG5IFHIKDI9C333F1D82FAE1"></script>531
平时工作中可能会遇到当试图对库表中的某一列或几列创建唯一索引时,系统提示 ORA-01452 :不能创建唯一索引,发现重复记录。



平时工作中可能会遇到当试图对库表中的某一列或几列创建唯一索引时,系统提示 ORA-01452 :不能创建唯一索引,发现重复记录。

  下面总结一下几种查找和删除重复记录的方法(以表CZ为例):

  表CZ的结构如下:

  SQL> desc cz

  Name Null? Type

  ----------------------------------------- -------- ------------------

  C1 NUMBER(10)

  C10 NUMBER(5)

  C20 VARCHAR2(3)

  删除重复记录的方法原理:

  (1).在Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、块、行上。

  (2).在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大rowid的就可以了,其余全部删除。

  重复记录判断的标准是:

  C1,C10和C20这三列的值都相同才算是重复记录。

  经查看表CZ总共有16条记录:

  SQL>set pagesize 100

  SQL>select * from cz;

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  1 2 dsf

  1 2 dsf

  1 2 dsf

  2 3 che

  1 2 dsf

  1 2 dsf

  1 2 dsf

  1 2 dsf

  2 3 che

  2 3 che

  2 3 che

  2 3 che

  3 4 dff

  3 4 dff

  3 4 dff

  4 5 err

  5 3 dar

  6 1 wee

  7 2 zxc

  20 rows selected.

  1.查找重复记录的几种方法:

  (1).SQL>select * from cz group by c1,c10,c20 having count(*) >1;

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  2 3 che

  3 4 dff

  (2).SQL>select distinct * from cz;

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  2 3 che

  3 4 dff

  (3).SQL>select * from cz a where rowid=(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20);

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  2 3 che

  3 4 dff

  2.删除重复记录的几种方法:

  (1).适用于有大量重复记录的情况(在C1,C10和C20列上建有索引的时候,用以下语句效率会很高):

  SQL>delete from cz where (c1,c10,c20) in (select c1,c10,c20 from cz group by c1,c10,c20 having count(*)>1) and rowid not in

  (select min(rowid) from cz group by c1,c10,c20 having count(*)>1);

  SQL>delete fron cz where rowid not in(select min(rowid) from cz group by c1,c10,c20);

  (2).适用于有少量重复记录的情况(注意,对于有大量重复记录的情况,用以下语句效率会很低):

  SQL>delete from cz a where a.rowid!=(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20);

  SQL>delete from cz a where a.rowid<(select max(rowid) from cz b where a.c1=b.c1 and a.c10=b.c10 and a.c20=b.c20);

  SQL>delete from cz a where rowid <(select max(rowid) from cz where c1=a.c1 and c10=a.c10 and c20=a.c20);

  (3).适用于有少量重复记录的情况(临时表法):

  SQL>create table test as select distinct * from cz; (建一个临时表test用来存放重复的记录)

  SQL>truncate table cz; (清空cz表的数据,但保留cz表的结构)

  SQL>insert into cz select * from test; (再将临时表test里的内容反插回来)
   (4).适用于有大量重复记录的情况(Exception into 子句法):

  采用alter table 命令中的 Exception into 子句也可以确定出库表中重复的记录。这种方法稍微麻烦一些,为了使用“excepeion into ”子句,必须首先创建 EXCEPTIONS 表。创建该表的 SQL 脚本文件为 utlexcpt.sql 。对于win2000系统和 UNIX 系统, Oracle 存放该文件的位置稍有不同,在win2000系统下,该脚本文件存放在$ORACLE_HOME\Ora90\rdbms\admin 目录下;而对于 UNIX 系统,该脚本文件存放在$ORACLE_HOME/rdbms/admin 目录下。

  具体步骤如下:

  SQL>@?/rdbms/admin/utlexcpt.sql

  Table created.

  SQL>desc exceptions

  Name Null? Type

  ----------------------------------------- -------- --------------

  ROW_ID ROWID

  OWNER VARCHAR2(30)

  TABLE_NAME VARCHAR2(30)

  CONSTRAINT VARCHAR2(30)

  SQL>alter table cz add constraint cz_unique unique(c1,c10,c20) exceptions into exceptions;

  *

  ERROR at line 1:

  ORA-02299: cannot validate (TEST.CZ_UNIQUE) - duplicate keys found

  SQL>create table dups as select * from cz where rowid in (select row_id from exceptions);

  Table created.

  SQL>select * from dups;

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  1 2 dsf

  1 2 dsf

  1 2 dsf

  2 3 che

  1 2 dsf

  1 2 dsf

  1 2 dsf

  1 2 dsf

  2 3 che

  2 3 che

  2 3 che

  2 3 che

  3 4 dff

  3 4 dff

  3 4 dff

  16 rows selected.

  SQL>select row_id from exceptions;

  ROW_ID

  ------------------

  AAAHD/AAIAAAADSAAA

  AAAHD/AAIAAAADSAAB

  AAAHD/AAIAAAADSAAC

  AAAHD/AAIAAAADSAAF

  AAAHD/AAIAAAADSAAH

  AAAHD/AAIAAAADSAAI

  AAAHD/AAIAAAADSAAG

  AAAHD/AAIAAAADSAAD

  AAAHD/AAIAAAADSAAE

  AAAHD/AAIAAAADSAAJ

  AAAHD/AAIAAAADSAAK

  AAAHD/AAIAAAADSAAL

  AAAHD/AAIAAAADSAAM

  AAAHD/AAIAAAADSAAN

  AAAHD/AAIAAAADSAAO

  AAAHD/AAIAAAADSAAP

  16 rows selected.

  SQL>delete from cz where rowid in ( select row_id from exceptions);

  16 rows deleted.

  SQL>insert into cz select distinct * from dups;

  3 rows created.

  SQL>select *from cz;

  C1 C10 C20

  ---------- ---------- ---

  1 2 dsf

  2 3 che

  3 4 dff

  4 5 err

  5 3 dar

  6 1 wee

  7 2 zxc

  7 rows selected.

  从结果里可以看到重复记录已经删除。

分享到:
评论

相关推荐

    删除数据表中重复记录

    删除重复记录的核心思想是先识别出哪些记录是重复的,然后通过某种方式将这些重复记录从数据表中移除。通常的做法包括: 1. **识别重复记录**:通过`GROUP BY`和`HAVING`子句找出具有相同字段值的记录。 2. **标记...

    Oracle数据库删除表中重复记录的方法三则.txt

    首先创建一个新表并插入去重后的数据,然后删除旧表,并将新表重命名为旧表的名字,以此达到删除重复记录的效果。 **SQL示例代码:** ```sql SELECT DISTINCT * INTO new_table FROM old_table ORDER BY ...; DROP...

    删除表中重复记录

    当表中的某个字段(id)是唯一主键时,可以使用以下语句删除重复记录: ```sql DELETE FROM table WHERE id NOT IN ( SELECT MAX(id) FROM table GROUP BY col1, col2, ...,coln ) ``` 其中`col1, col2, ..., ...

    plsql删除重复记录

    在开始删除重复记录之前,首先需要确定哪些记录是重复的。以下SQL语句可以用来查询`test`表中所有字段都重复的记录: ```sql SELECT * FROM test GROUP BY name, age, sex, id, sf HAVING COUNT(*) &gt; 1; ``` 这里...

    sql删除表中重复记录方法

    这种方法通过创建两个临时表来辅助删除重复记录的过程。首先,通过`GROUP BY`和`COUNT(*)`函数找出重复的记录,并将这些记录的ID存储到临时表`temp1`中。接着,将不重复的记录也插入到`temp1`中。之后,创建一个新的...

    oracle中如何删除重复的记录

    这种方法适用于只需要删除重复记录中的某些行的情况。步骤如下: 1. **找出重复的记录**:首先,我们需要找到那些重复的记录。可以通过子查询来实现这一点。 ```sql SELECT age FROM ( SELECT age, COUNT(*) as...

    删除表中重复数据sql语句

    2. **删除表中多余的重复记录** - **删除单字段重复记录(保留最小ROWID)** ```sql DELETE FROM people WHERE peopleId IN ( SELECT peopleId FROM people GROUP BY peopleId HAVING COUNT(peopleId) &gt; 1 ...

    SQL语句删除重复记录

    Knowledge Point 1: 使用临时表删除重复记录 在这种方法中,我们首先将重复的记录记入一个临时表temp1,然后将不重复的记录记入另一个临时表temp2,最后删除原表中的重复记录并将temp2中的记录插入回原表。 优点...

    怎样删除数据库中重复记录

    这就是使用临时表来删除重复记录。我们可以创建一个临时表,具有相同的结构,然后将数据从原表中拷贝到临时表中。最后,我们可以删除原表中的数据,并将临时表中的数据导入原表中。 结论 删除数据库中重复记录是...

    Oracle删除表中的重复数据

    重复数据的存在不仅会占用额外的存储空间,还可能导致数据统计错误、数据分析偏差等问题,因此,有效地删除表中的重复数据是保持数据质量和提高数据库性能的重要环节。本文将详细解析如何在Oracle中删除表中的重复...

    SQL语句删除数据表中重复的记录

    以下是如何使用SQL语句来删除数据表中重复记录的详细步骤。 首先,我们来看一个简单的例子,假设我们有一个名为`Repeat`的数据表,其中存在重复的记录。要删除这些重复的记录,但保留每个唯一组合的最新(最大`id`...

    基于深度学习的大规模数据库重复记录删除研究.pdf

    基于深度学习的大规模数据库重复记录删除方法首先对已有数据库重复记录删除方法进行分析,找到引起数据库重复记录删除不理想的因素,然后采用深度学习算法对数据库重复记录数据进行学习,建立数据库重复记录的分类器...

    查询及删除重复记录的SQL语句.

    删除重复记录时,通常保留一个代表性的记录,例如保留 `ROWID` 最小的记录。可以使用以下 SQL 语句: ```sql DELETE from 表 WHERE (id) IN ( SELECT id FROM 表 GROUP BY id HAVING COUNT(id) &gt; 1) AND ...

    最高效的删除重复记录方法

    ### 最高效的删除重复记录方法 在数据库管理过程中,删除重复记录是一项常见的需求,尤其是在数据清洗、维护数据一致性等方面。本文将详细介绍一种高效的方法来删除Oracle数据库中的重复记录,并通过具体的SQL语句...

    VB删除Access数据库中重复记录(已测试,编译通过)

    在Access中一般只能查找10行大概20条重复记录,这样程序就可以任意指定表及多字段检索重复记录,并把重复的记录移除到一个临时表中,并不是进行真正删除,你可以进行恢复。但是执行第二次查找时则自动删除上次查找的...

    MySQL删除重复记录

    MySQL作为最受欢迎的关系型数据库管理系统之一,提供了多种功能来处理数据,包括如何有效地删除重复记录。本文将深入探讨MySQL中删除重复记录的方法,以及如何利用其特性来优化数据管理流程。 ### MySQL删除重复...

    删除Access数据库中重复的记录

    在Access中一般只能查找10行大概20条重复记录,这样程序就可以任意指定表及多字段检索重复记录,并把重复的记录移除到一个临时表中,并不是进行真正删除,你可以进行恢复。但是执行第二次查找时则自动删除上次查找的...

    oracle删除重复记录性能分析

    ### Oracle删除重复记录性能分析 #### 一、背景与需求 在数据库管理中,经常会遇到数据清理的需求,尤其是在Oracle数据库中处理重复记录时。本文旨在通过对比几种不同的方法来删除Oracle中的重复记录,并分析其...

    如何删除表中重复数据

    这种方法不需要创建临时表,而是直接通过子查询的方式删除重复记录。 1. **确定唯一标识字段**: 首先需要确定哪些字段组合起来可以作为一条记录的唯一标识,比如主键或一组具有唯一性的字段。 2. **删除重复记录...

Global site tag (gtag.js) - Google Analytics