`

SQL查询表中重复数据

    博客分类:
  • SQL
阅读更多
SQL查询重复数据

有例表:emp

   emp_no         name    age     
    001           Tom      17     
    002           Sun      14     
    003           Tom      15     
    004           Tom      16

要求:

列出所有名字重复的人的记录

(1)最直观的思路:要知道所有名字有重复人资料,首先必须知道哪个名字重复了:

select name from emp group by name having count(*) > 1;

所有名字重复人的记录是:

select * from emp where name in 
(select name from emp group by name having count(*) > 1)

(2)稍微再聪明一点,就会想到,如果对每个名字都和原表进行比较,大于2个人名字与这条记录相同的就是合格的 ,就有

select * from emp where (select count(*) from emp e where e.name = emp.name) > 1;

--注意一下这个>1,想下如果是 =1,如果是 =2 如果是>2 如果 e 是另外一张表 而且是=0那结果 就更好玩了:)

这个过程是 在判断工号为001的 人 的时候先取得 001的 名字(emp.name) 然后和原表的名字进行比较 e.name

注意e是emp的一个别名。

再稍微想得多一点,就会想到,如果有另外一个名字相同的人工号不与她他相同那么这条记录符合要求:

select * from emp where exists
(select * from emp e where e.name = emp.name and e.emp_no <> emp.emp_no);

此思路的join写法:

select emp.* from emp,emp e where emp.name = e.name and emp.emp_no <> e.emp_no;
/*     这个语句较规范的   join   写法是     
select emp.* from emp inner join emp e on emp.name = e.name and emp.emp_no <> e.emp_no;
但个人比较倾向于前一种写法,关键是更清晰     */   


  
b、有例表:emp     
name     age     
Tom       16     
Sun       14     
Tom       16     
Tom       16

----------------------------------------------------清除重复----------------------------------------------------
过滤掉所有多余的重复记录 
(1)我们知道distinct、group by 可以过滤重复,于是就有最直观的

select distinct * from emp 或 select name,age from emp group by name,age;

获得需要的数据,如果可以使用临时表就有解法:

select distinct * into #tmp from emp;
    delete from emp;
    insert into emp select * from #tmp;

(2)但是如果不可以使用临时表,那该怎么办? 
我们观察到我们没办法区分数据(物理位置不一样,对 SQL Server来说没有任何区别),思路自然是想办法把数据区分出来了,既然现在的所有的列都没办法区分数据,唯一的办法就是再加个列让它区分出来,加什么列好?最佳选择是identity列:

alter table emp add chk int identity(1,1);

表示例:

    name   age   chk     
    Tom     16     1     
    Sun     14     2     
    Tom     16     3     
    Tom     16     4

重复记录可以表示为:

select * from emp where (select count(*) from emp e where e.name = emp.name)>1;

要删除的是:

delete from emp 
where (select count(*) from emp e where e.name = emp.name and e.chk >= emp.chk)>1;

再把添加的列删掉,出现结果。

alter table emp drop column chk;


(3)另一个思路: 
视图

select min(chk) from emp group by name having count(*) > 1;

获得有重复的记录chk最小的值,于是可以

delete from emp where chk not in (select min(chk) from emp group by name);

写成join的形式也可以:

(1)有例表:emp

    emp_no         name    age     
    001            Tom      17     
    002            Sun      14     
    003            Tom      15     
    004            Tom      16

◆要求生成序列号 
(1)最简单的方法,根据b问题的解法:

alter table emp add chk int identity(1,1);   或   
select *, identity(int,1,1) chk into #tmp from emp;

◆如果需要控制顺序怎么办?

select top 100000 *, identity(int,1,1) chk into #tmp from emp order by age;

(2) 假如不可以更改表结构,怎么办? 
如果不可以唯一区分每条记录是没有办法的,在可以唯一区分每条记录的时候,可以使用a 中的count的思路解决这个问题

select emp.*, (select count(*) from emp e where e.emp_no <= emp.emp_no)   
    from emp
    order by  (select count(*) from emp e where e.emp_no <= emp.emp_no);

转自http://www.cnblogs.com/yellowapplemylove/archive/2011/04/19/2021519.html
分享到:
评论

相关推荐

    删除表中重复数据sql语句

    1. **查询表中重复数据** - **单字段重复数据查询** ```sql SELECT * FROM people WHERE peopleId IN ( SELECT peopleId FROM people GROUP BY peopleId HAVING COUNT(peopleId) &gt; 1 ) ``` - **多字段...

    sql查询表中某字段下所有重复的记录

    sql查询表中某字段下所有重复的记录,删除某字段下重复记录最小的那笔记录

    查询重复数据sql语句

    本文详细介绍了如何使用SQL查询表中的重复数据,包括对给出的示例SQL语句进行了逐行解释,并探讨了其他的查询方法。正确地识别和处理重复数据对于维护数据质量至关重要。不同的场景可能需要采用不同的策略和技术。...

    sql 查询重复数据

    SQL 查询重复数据 在数据库中,查询和处理重复数据是一项常见的任务。本文将详细介绍查询和处理重复数据的方法,包括查找所有重复记录、查找重复记录、删除重复记录等。 查找所有重复记录 使用以下 SQL 语句可以...

    查询和删除表中重复数据sql语句

    ### 查询表中重复数据 #### 单字段重复数据查询 ```sql SELECT * FROM people WHERE peopleId IN (SELECT peopleId FROM people GROUP BY peopleId HAVING COUNT(peopleId) &gt; 1); ``` 这条SQL语句用于查找`people`...

    SQL删除表里的重复数据的两种方法

    本文将详细介绍SQL中删除表内重复数据的两种方法,并对每种方法进行深入解析。 #### 方法一:使用子查询删除重复记录 这种方法主要是通过子查询来找到重复记录并删除它们。具体步骤如下: 1. **确定重复字段**:...

    MySQL根据某一个或者多个字段查找重复数据的sql语句

    sql 查出一张表中重复...2、查询出所有数据进行分组之后,和重复数据的重复次数的查询数据,先列下: select count(username) as '重复次数',username from xi group by username having count(*)&gt;1 order by userna

    经常面试到的SQL题(查询重复数据和清除重复数据)

    在SQL中,查询和清除重复数据是数据库管理中常见的任务,尤其在面试中,这个问题经常被用来测试候选人的技能和经验。以下是对这个主题的详细解释。 首先,我们需要理解什么是重复数据。在数据库中,重复数据指的是...

    sql+如何去重复数据,数据库去重复数据

    在数据库管理过程中,去除重复数据是一项非常重要的任务。这不仅有助于提高数据质量,还能优化查询性能,确保数据的一致性和准确性。SQL作为一种广泛使用的数据库语言,提供了多种方法来处理重复数据问题。根据提供...

    查询和删除表中重复数据

    ### 知识点一:查询表中的重复数据 在数据库管理中,经常会遇到需要查找表中重复数据的情况。这可以通过多种方式实现,具体方法取决于所使用的数据库管理系统(DBMS)。在本案例中,主要介绍了通过以下几种方法来...

    sql查询重复记录方法大全

    ### SQL查询重复记录方法大全 在数据库管理与维护过程中,查询和处理重复记录是一项非常重要的工作。本文将详细介绍几种常见的SQL查询重复记录的方法,并提供具体的示例代码。 #### 方法一:查询具有重复值的记录...

    如何删除表中重复数据

    以上介绍了三种删除表中重复数据的方法:使用临时表、使用子查询以及使用`ROW_NUMBER()`函数。不同的数据库系统可能支持的功能不同,因此在实际操作时需要根据所使用的数据库类型选择合适的方法。同时,在执行任何...

    search-double-data.zip_sql重复查询_重复数据

    2. **SQL查询重复数据**:最基础的方法是使用`GROUP BY`和`HAVING`子句来查找重复项。例如,如果你有一个名为`users`的表,包含`email`字段,你可以运行以下查询: ```sql SELECT email, COUNT(*) FROM users ...

    Oracle查询表里的重复数据方法

    在Oracle数据库中,查询和处理重复数据是一项常见的任务,尤其在数据清洗和数据整合的过程中显得尤为重要。本篇文章将详细介绍如何在Oracle中查询和删除重复数据。 首先,我们要明确什么是重复数据。在一个表中,...

    sql+如何去重复数据

    在SQL中,处理重复数据是常见的数据清洗任务。当我们面对数据表中存在多条相同记录的问题时,需要采取策略来去除这些重复项,确保数据的唯一性和准确性。以下是一些关于如何在SQL中去重的关键知识点: 1. **...

    删除表中重复数据sql语句.docx

    1. **查询表中重复数据**: 使用`GROUP BY`和`HAVING`子句可以找出表中重复的数据。例如,以下查询将返回`peopleId`出现超过一次的所有行: ```sql SELECT * FROM people WHERE peopleId IN ( SELECT peopleId ...

    OracleSQL实例-删除重复数据行留最新日期实例.pdf

    在Oracle SQL中,删除重复数据并保留最新日期的实例是一个常见的数据清理任务,尤其是在具有历史记录或事务数据的数据库中。这个实例展示了如何通过SQL查询有效地处理这种情况。在这个例子中,我们有一个名为`abc`的...

    删除SQL Server 200表中重复数据.pdf

    本文主要讨论如何删除表中的重复数据,以及在SQL Server 2000中遇到的一些常见问题和解决方案。 首先,让我们关注如何删除重复数据。在SQL Server中,有多种方法可以处理这种情况。一种方法是通过编写SQL程序脚本来...

    经常面试到的SQL题(查询重复数据和清除重复数据).

    总结来说,查询和清除SQL中的重复数据是数据库管理的关键技能。通过使用`GROUP BY`和`HAVING`来发现重复,以及通过创建新表和删除旧表来清除重复,我们可以保持数据的准确性和一致性。然而,实际操作时应谨慎,充分...

    sql去掉重复的数据 完全相同的数据去掉重复 及优化

    本文将详细探讨如何利用SQL查询语句来去除表中的重复记录,并在此基础上进一步讨论如何进行性能优化。 #### 一、基本概念与背景 在实际工作中,数据库中的数据可能会因为各种原因而出现重复,例如数据录入错误、...

Global site tag (gtag.js) - Google Analytics