比如现在有一人员表 (表名:peosons)
若想将姓名、身份证号、住址这三个字段完全相同的记录查询出来
select p1.* from persons p1,persons p2
where p1.idp2.id
and p1.cardid = p2.cardid and p1.pname = p2.pname and p1.address = p2.address
可以实现上述效果。
几个删除重复记录的SQL语句
1.用rowid方法
2.用group by方法
3.用distinct方法
1。用rowid方法
据据oracle带的rowid属性,进行判断,是否存在重复,语句如下:
查数据:
select * from table1 a where rowid !=(select max(rowid)
from table1 b where a.name1=b.name1 and a.name2=b.name2……)
删数据:
delete from table1 a where rowid !=(select max(rowid)
from table1 b where a.name1=b.name1 and a.name2=b.name2……)
2.group by方法
查数据:
select count(num), max(name) from student --列出重复的记录数,并列出他的name属性
group by num
having count(num) >1 --按num分组后找出表中num列重复,即出现次数大于一次
删数据:
delete from student
group by num
having count(num) >1
这样的话就把所有重复的都删除了。
3.用distinct方法 -对于小的表比较有用
create table table_new as select distinct * from table1 minux
truncate table table1;
insert into table1 select * from table_new;
查询及删除重复记录的方法大全
1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断
select * from people
where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)
2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录
delete from people
where peopleId in (select peopleId from people group by peopleId
having count(peopleId) > 1)
and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)
3、查找表中多余的重复记录(多个字段)
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录
delete from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)
5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录
select * from vitae a
where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)
and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)
(二)
比方说
在A表中存在一个字段“name”,
而且不同记录之间的“name”值有可能会相同,
现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;
Select Name,Count(*) From A Group By Name Having Count(*) > 1
如果还查性别也相同大则如下:
Select Name,***,Count(*) From A Group By Name,*** Having Count(*) > 1
(三)
方法一
declare @max integer,@id integer
declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1
open cur_rows
fetch cur_rows into @id,@max
while @@fetch_status=0
begin
select @max = @max -1
set rowcount @max
delete from 表名 where 主字段 = @id
fetch cur_rows into @id,@max
end
close cur_rows
set rowcount 0
方法二
"重复记录"有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重复的记录,
比如Name字段重复,而其他字段不一定重复或都重复可以忽略。
1、对于第一种重复,比较容易解决,使用
select distinct * from tableName就可以得到无重复记录的结果集。
如果该表需要删除重复的记录(重复记录保留1条),可以按以下方法删除
select distinct * into #Tmp from tableName
drop table tableName
select * into tableName from #Tmp
drop table #Tmp
发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。
2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下
假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集
select identity(int,1,1) as autoID, * into #Tmp from tableName
select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID
select * from #Tmp where autoID in(select autoID from #tmp2)
最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写在select子句中省去此列)
(四)
查询重复
select * from tablename where id in (
select id from tablename
group by id
having count(id) > 1
)
原文出自【比特网】,转载请保留原文链接:http://soft.chinabyte.com/database/308/12346308.shtml
分享到:
相关推荐
对于大型数据库如Oracle来说,CDC的应用不仅能够提高数据处理效率,还能支持数据同步、数据仓库构建等多种应用场景。 #### 二、Oracle CDC 的基本原理 Oracle CDC 是一种用于捕捉数据库表中数据变更的技术,它能够...
### Oracle数据库中的海量数据处理 #### 数据仓库系统的特点与Oracle数据仓库简介 数据仓库系统是一种专门设计用于存储、管理和分析企业历史数据的信息管理系统。它的特点包括面向主题、集成性、随时间变化以及非...
这在需要处理不同数据库类型或者需要实现数据冗余和故障切换的场景中尤其有用。 首先,我们要理解MySQL和Oracle的基本特性。MySQL是一款开源、免费的关系型数据库管理系统,以其高效、易用和灵活的特点广受欢迎。而...
这些模型通过减少冗余数据和优化查询性能来提升数据仓库的效率。在Oracle中,物化视图和分区技术也是提高查询速度的关键。 其次,Oracle的RAC(Real Application Clusters)和Exadata等技术使得大规模数据仓库的...
- **提高运营效率**:减少冗余数据处理,加快业务流程执行速度。 - **降低合规风险**:通过实施严格的数据治理措施,降低违反法规的风险。 - **支持增长和发展**:灵活的架构设计允许轻松扩展至新的业务实体或领域。...
- **降低成本**:减少数据冗余和重复处理,简化数据管理和维护工作。 - **提升数据质量**:统一数据标准和格式,确保数据一致性。 - **增强灵活性**:灵活地支持多种数据查询方式,满足不同层次用户的需要。 #### 2...
Oracle数据仓库是一种高效的数据存储和分析系统,专为大规模数据处理和商业智能应用设计。本教程将通过两部分——"数据仓库_day1.ppt"和"数据仓库_day2.ppt",深入讲解Oracle数据仓库的核心概念和技术。 首先,我们...
综上所述,基于Delphi的Excel与Oracle数据互转换技术为用户提供了便捷的数据管理途径,简化了数据的导入导出流程,提升了数据处理的效率和准确性。在实际应用中,可以根据具体需求进行定制化开发,满足不同业务场景...
多数据源支持Oracle、Mysql、Sql Server 等数据库夸库操作,使用 @DS 切换数据源。, 可设置多主多从 、纯粹多库(记得设置primary) 、混合配置等; Hutool工具类库,降低相关API的学习成本,提高工作效率;
在IT领域,尤其是在数据库管理和软件开发中,对数据进行格式化处理是一项常见且重要的任务。...这对于财务系统中的报表生成、数据展示等场景具有重要意义,同时也展示了Oracle数据库在复杂数据处理方面的强大能力。
Oracle的数据仓库系统基于其强大的数据库技术,包括Oracle数据库10G及更高版本,为用户提供了高性能的数据存储和处理能力。系统包括数据集成工具、数据仓库构建工具、报表和分析工具等组件,形成一个完整的端到端...
Oracle数据库中的重复数据是指在表中存在完全相同的数据行,通常这在数据库设计和数据操作中是不被允许的,因为它可能导致数据的不一致性和数据冗余。在数据迁移过程中,重复数据的问题尤为突出,可能会影响数据的...
根据访问频率对表进行分割、存储冗余数据、存储衍生列等。 2. **磁盘I/O调整**:通过分散数据文件到独立磁盘,创建单独的表空间,分离索引和表,创建用户表空间和回滚段专用表空间,以及使用RAID等策略,减少I/O竞争...
Oracle数据库在处理海量数据时,查询优化是一个至关重要的议题,因为当数据量达到一定规模时,系统的响应时间和资源消耗往往成为性能瓶颈。本文主要探讨了针对Oracle数据库进行查询优化的各种策略和技术,包括合理...
在Oracle数据库系统中,处理大数据量是常见的挑战,尤其是在企业级应用中。Oracle提供了多种高效的数据处理策略,以确保性能和稳定性。以下是一些关键的知识点,这些知识点可以帮助你理解和应对Oracle中的大数据量...
1. **表结构设计**:合理规划字段类型,避免冗余数据,确保数据的一致性和完整性。 2. **索引策略**:根据查询模式创建有效的索引,以加快查询速度。同时,需定期维护索引,防止其碎片化导致性能下降。 3. **分区与...
【基于Java和Oracle数据库的航空飞行电报数据处理】 在航空交通管制中,飞行电报是一种至关重要的数据来源,它包含了航班的关键信息,如航班号、起飞与降落机场、时间、飞机型号、尾流等级等。为了有效地整合并利用...
- **减少冗余**:避免重复存储相同数据,减少存储成本,提高数据一致性。 - **数据独立性**:物理结构和逻辑结构的分离,使数据的存储和访问更加灵活。 - **集中控制**:统一管理数据的访问权限和安全性,便于...
Oracle数据库同样提供了事务管理机制,如多版本并发控制(MVCC),以处理多个用户同时访问同一数据的情况。 8. **性能调优**:为了最大化系统效率,必须对数据库进行性能调优。这可能包括SQL查询优化、索引策略调整...
该技术由一个主数据库(Primary)和一个或多个备用数据库(Standby)组成,能够在不同地理位置创建冗余,以防止数据丢失或系统中断。 在Oracle数据库体系结构中,实例(Instance)和数据库(Database)是核心组成...