`

ORACLE 处理冗余数据[转]

 
阅读更多
比如现在有一人员表 (表名:peosons)

  若想将姓名、身份证号、住址这三个字段完全相同的记录查询出来

  
select p1.* from persons p1,persons p2

          where p1.idp2.id

and p1.cardid = p2.cardid and p1.pname = p2.pname and p1.address = p2.address


  可以实现上述效果。

  几个删除重复记录的SQL语句

  1.用rowid方法

  2.用group by方法

  3.用distinct方法

  1。用rowid方法

  据据oracle带的rowid属性,进行判断,是否存在重复,语句如下:

  查数据:

 

  select * from table1 a where rowid !=(select max(rowid) 

  from table1 b where a.name1=b.name1 and a.name2=b.name2……) 


  删数据:

  delete from table1 a where rowid !=(select max(rowid) 

  from table1 b where a.name1=b.name1 and a.name2=b.name2……) 


  2.group by方法

  查数据:
  select count(num), max(name) from student --列出重复的记录数,并列出他的name属性 

  group by num 

  having count(num) >1 --按num分组后找出表中num列重复,即出现次数大于一次 


  删数据:

  delete from student 

  group by num 

  having count(num) >1 



  这样的话就把所有重复的都删除了。

  3.用distinct方法 -对于小的表比较有用

  create table table_new as select distinct * from table1 minux

  truncate table table1;

  insert into table1 select * from table_new;

  查询及删除重复记录的方法大全

  1、查找表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断

  select * from people

  where peopleId in (select peopleId from people group by peopleId having count(peopleId) > 1)

  2、删除表中多余的重复记录,重复记录是根据单个字段(peopleId)来判断,只留有rowid最小的记录

  delete from people

  where peopleId in (select peopleId from people group by peopleId

  having count(peopleId) > 1)

  and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)

  3、查找表中多余的重复记录(多个字段)

  select * from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  4、删除表中多余的重复记录(多个字段),只留有rowid最小的记录

  delete from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

  5、查找表中多余的重复记录(多个字段),不包含rowid最小的记录

  select * from vitae a

  where (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having count(*) > 1)

  and rowid not in (select min(rowid) from vitae group by peopleId,seq having count(*)>1)

  (二)

  比方说

  在A表中存在一个字段“name”,

  而且不同记录之间的“name”值有可能会相同,

  现在就是需要查询出在该表中的各记录之间,“name”值存在重复的项;

  Select Name,Count(*) From A Group By Name Having Count(*) > 1

  如果还查性别也相同大则如下:

  Select Name,***,Count(*) From A Group By Name,*** Having Count(*) > 1

  (三)

  方法一

  declare @max integer,@id integer

  declare cur_rows cursor local for select 主字段,count(*) from 表名 group by 主字段 having count(*) >; 1

  open cur_rows

  fetch cur_rows into @id,@max

  while @@fetch_status=0

  begin

  select @max = @max -1

  set rowcount @max

  delete from 表名 where 主字段 = @id

  fetch cur_rows into @id,@max

  end

  close cur_rows

  set rowcount 0

  方法二

  "重复记录"有两个意义上的重复记录,一是完全重复的记录,也即所有字段均重复的记录,二是部分关键字段重复的记录,

  比如Name字段重复,而其他字段不一定重复或都重复可以忽略。

  1、对于第一种重复,比较容易解决,使用

  select distinct * from tableName就可以得到无重复记录的结果集。

  如果该表需要删除重复的记录(重复记录保留1条),可以按以下方法删除

  select distinct * into #Tmp from tableName

  drop table tableName

  select * into tableName from #Tmp

  drop table #Tmp

  发生这种重复的原因是表设计不周产生的,增加唯一索引列即可解决。

  2、这类重复问题通常要求保留重复记录中的第一条记录,操作方法如下

  假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集

  select identity(int,1,1) as autoID, * into #Tmp from tableName

  select min(autoID) as autoID into #Tmp2 from #Tmp group by Name,autoID

  select * from #Tmp where autoID in(select autoID from #tmp2)

  最后一个select即得到了Name,Address不重复的结果集(但多了一个autoID字段,实际写时可以写在select子句中省去此列)

  (四)

  查询重复

  select * from tablename where id in (

  select id from tablename

  group by id

  having count(id) > 1

  )


原文出自【比特网】,转载请保留原文链接:http://soft.chinabyte.com/database/308/12346308.shtml

分享到:
评论

相关推荐

    Oracle_数据库中的海量数据处理

    ### Oracle数据库中的海量数据处理 #### 数据仓库系统的特点与Oracle数据仓库简介 数据仓库系统是一种专门设计用于存储、管理和分析企业历史数据的信息管理系统。它的特点包括面向主题、集成性、随时间变化以及非...

    mysql和Oracle的多数据源配置demo

    这在需要处理不同数据库类型或者需要实现数据冗余和故障切换的场景中尤其有用。 首先,我们要理解MySQL和Oracle的基本特性。MySQL是一款开源、免费的关系型数据库管理系统,以其高效、易用和灵活的特点广受欢迎。而...

    oracle数据仓库教程

    这些模型通过减少冗余数据和优化查询性能来提升数据仓库的效率。在Oracle中,物化视图和分区技术也是提高查询速度的关键。 其次,Oracle的RAC(Real Application Clusters)和Exadata等技术使得大规模数据仓库的...

    Oracle主数据管理数据表

    - **提高运营效率**:减少冗余数据处理,加快业务流程执行速度。 - **降低合规风险**:通过实施严格的数据治理措施,降低违反法规的风险。 - **支持增长和发展**:灵活的架构设计允许轻松扩展至新的业务实体或领域。...

    Oracle 数据仓库技术白皮书

    - **降低成本**:减少数据冗余和重复处理,简化数据管理和维护工作。 - **提升数据质量**:统一数据标准和格式,确保数据一致性。 - **增强灵活性**:灵活地支持多种数据查询方式,满足不同层次用户的需要。 #### 2...

    非常全面非常棒的oracle数据仓库教程ppt

    Oracle数据仓库是一种高效的数据存储和分析系统,专为大规模数据处理和商业智能应用设计。本教程将通过两部分——"数据仓库_day1.ppt"和"数据仓库_day2.ppt",深入讲解Oracle数据仓库的核心概念和技术。 首先,我们...

    基于Delphi的Excel与Oracle数据互转换技术.pdf

    综上所述,基于Delphi的Excel与Oracle数据互转换技术为用户提供了便捷的数据管理途径,简化了数据的导入导出流程,提升了数据处理的效率和准确性。在实际应用中,可以根据具体需求进行定制化开发,满足不同业务场景...

    springboot + mybatis-plus + oracle + 多数据源 + redis + hutool

    多数据源支持Oracle、Mysql、Sql Server 等数据库夸库操作,使用 @DS 切换数据源。, 可设置多主多从 、纯粹多库(记得设置primary) 、混合配置等; Hutool工具类库,降低相关API的学习成本,提高工作效率;

    oracle数字转换中文

    在IT领域,尤其是在数据库管理和软件开发中,对数据进行格式化处理是一项常见且重要的任务。...这对于财务系统中的报表生成、数据展示等场景具有重要意义,同时也展示了Oracle数据库在复杂数据处理方面的强大能力。

    Oracle重复数据清理

    Oracle数据库中的重复数据是指在表中存在完全相同的数据行,通常这在数据库设计和数据操作中是不被允许的,因为它可能导致数据的不一致性和数据冗余。在数据迁移过程中,重复数据的问题尤为突出,可能会影响数据的...

    面向大型数据处理系统的Oracle数据库性能优化技术.pdf

    根据访问频率对表进行分割、存储冗余数据、存储衍生列等。 2. **磁盘I/O调整**:通过分散数据文件到独立磁盘,创建单独的表空间,分离索引和表,创建用户表空间和回滚段专用表空间,以及使用RAID等策略,减少I/O竞争...

    基于Oracle数据库海量数据的查询优化研究 (3).pdf

    Oracle数据库在处理海量数据时,查询优化是一个至关重要的议题,因为当数据量达到一定规模时,系统的响应时间和资源消耗往往成为性能瓶颈。本文主要探讨了针对Oracle数据库进行查询优化的各种策略和技术,包括合理...

    oracle大数据量处理方案资料搜集

    在Oracle数据库系统中,处理大数据量是常见的挑战,尤其是在企业级应用中。Oracle提供了多种高效的数据处理策略,以确保性能和稳定性。以下是一些关键的知识点,这些知识点可以帮助你理解和应对Oracle中的大数据量...

    让Oracle跑得更快2:基于海量数据的数据库设计与.pdf

    1. **表结构设计**:合理规划字段类型,避免冗余数据,确保数据的一致性和完整性。 2. **索引策略**:根据查询模式创建有效的索引,以加快查询速度。同时,需定期维护索引,防止其碎片化导致性能下降。 3. **分区与...

    基于Java和Oracle数据库的航空飞行电报数据处理.pdf

    【基于Java和Oracle数据库的航空飞行电报数据处理】 在航空交通管制中,飞行电报是一种至关重要的数据来源,它包含了航班的关键信息,如航班号、起飞与降落机场、时间、飞机型号、尾流等级等。为了有效地整合并利用...

    企业oracle数据分析岗位面试题

    - **减少冗余**:避免重复存储相同数据,减少存储成本,提高数据一致性。 - **数据独立性**:物理结构和逻辑结构的分离,使数据的存储和访问更加灵活。 - **集中控制**:统一管理数据的访问权限和安全性,便于...

    IBM-ETP-Oracle03第三章 数据管理

    Oracle数据库同样提供了事务管理机制,如多版本并发控制(MVCC),以处理多个用户同时访问同一数据的情况。 8. **性能调优**:为了最大化系统效率,必须对数据库进行性能调优。这可能包括SQL查询优化、索引策略调整...

    基于Linux的Oracle Data Guard数据容灾系统.pdf

    该技术由一个主数据库(Primary)和一个或多个备用数据库(Standby)组成,能够在不同地理位置创建冗余,以防止数据丢失或系统中断。 在Oracle数据库体系结构中,实例(Instance)和数据库(Database)是核心组成...

Global site tag (gtag.js) - Google Analytics