`

数据库优化之我见

 
阅读更多
a. 数据库配置
   包括sga配置:数据缓存,共享池等。
      数据缓存可以根据需要来设定缓存策略,比如keep,recyle,defaultcelve。
      共享池的库缓存与sql的缓存相关。
b. 表结构的设计
    主键外键,索引。
    纵向拓展:表分区,垂直分库
    横向拓展:表分片

c. sql优化
    访问Table的方式
    变量绑定
3.       共享SQL语句
4. 选择最有效率的表名顺序(只在基于规则的优化器中有效)
5.       WHERE子句中的连接顺序.
6.     SELECT子句中避免使用 ‘ * ‘
7.     减少访问数据库的次数
    当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算
    索引的利用率, 绑定变量 , 读数据块等等. 由此可见, 减少访问数据库的
    次数 , 就能实际上减少ORACLE的工作量.
10.       删除重复记录

最高效的删除重复记录方法 ( 因为使用了ROWID)

DELETE FROM EMP E

WHERE E.ROWID > (SELECT MIN(X.ROWID)

                   FROM EMP X

                   WHERE X.EMP_NO = E.EMP_NO);

11.       用TRUNCATE替代DELETE
    当删除表中的记录时,在通常情况下, 回滚段(rollback segments ) 用来存放可以被恢复的信息.
    如果你没有COMMIT事务,ORACLE会将数据恢复到删除之前的状态(准确地说是恢复到执行删除命令之前的状况)

    而当运用TRUNCATE时, 回滚段不再存放任何可被恢复的信息.当命令运行后,数据不能被恢复.
    因此很少的资源被调用,执行时间也会很短.

(译者按: TRUNCATE只在删除全表适用,TRUNCATE是DDL不是DML)
14.       用Where子句替换HAVING子句

     避免使用HAVING子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理
     需要排序,总计等操作. 如果能通过WHERE子句限制记录的数目,那就能减少这方面的开销.

例如:

     低效:

     SELECT REGION,AVG(LOG_SIZE)

     FROM LOCATION

     GROUP BY REGION

     HAVING REGION REGION != ‘SYDNEY’

     AND REGION != ‘PERTH’

     高效

     SELECT REGION,AVG(LOG_SIZE)

     FROM LOCATION

     WHERE REGION REGION != ‘SYDNEY’

     AND REGION != ‘PERTH’

     GROUP BY REGION

(译者按: HAVING 中的条件一般用于对一些集合函数的比较,如COUNT() 等等. 除此而外,一般的条件应该写在WHERE子句中)

15.       减少对表的查询

在含有子查询的SQL语句中,要特别注意减少对表的查询.  
17.       使用表的别名(Alias)

   当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.
   这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.
25.       用索引提高效率

索引是表的一个概念部分,用来提高检索数据的效率. 实际上,ORACLE使用了一个
复杂的自平衡B-tree结构. 通常,通过索引查询数据比全表扫描要快. 当ORACLE找
出执行查询和Update语句的最佳路径时, ORACLE优化器将使用索引. 同样在联结多
个表时使用索引也可以提高效率. 另一个使用索引的好处是,它提供了主键(primary key)的
唯一性验证.

除了那些LONG或LONG RAW数据类型, 你可以索引几乎所有的列. 通常, 在大型
表中使用索引特别有效. 当然,你也会发现, 在扫描小表时,使用索引同样能提
高效率.

虽然使用索引能得到查询效率的提高,但是我们也必须注意到它的代价. 索引需要空间来

存储,也需要定期维护, 每当有记录在表中增减或索引列被修改时, 索引本身也会被修
改. 这意味着每条记录的INSERT , DELETE , UPDATE将为此多付出4 , 5 次的磁盘I/O .
因为索引需要额外的存储空间和处理,那些不必要的索引反而会使查询反应时间变慢.

译者按:

定期的重构索引是有必要的.

ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>

26.       索引的操作

ORACLE对索引有两种访问模式.

索引唯一扫描 ( INDEX UNIQUE SCAN)

大多数情况下, 优化器通过WHERE子句访问INDEX.

例如:

表LODGING有两个索引 : 建立在LODGING列上的唯一性索引LODGING_PK和建立在MANAGER列上的非唯一性索引LODGING$MANAGER. 

SELECT *

FROM LODGING

WHERE LODGING = ‘ROSE HILL’;

   在内部 , 上述SQL将被分成两步执行, 首先 , LODGING_PK 索引将通过索
   引唯一扫描的方式被访问 , 获得相对应的ROWID, 通过ROWID访问表的方
   式 执行下一步检索.

   如果被检索返回的列包括在INDEX列中,ORACLE将不执行第二步的处理(通
   过ROWID访问表). 因为检索数据保存在索引中, 单单访问索引就可以完
   全满足查询结果.

   下面SQL只需要INDEX UNIQUE SCAN 操作.       

        SELECT LODGING

        FROM  LODGING

WHERE LODGING = ‘ROSE HILL’;

  索引范围查询(INDEX RANGE SCAN)

      适用于两种情况:

1.       基于一个范围的检索

2.       基于非唯一性索引的检索

例1:

      SELECT LODGING

      FROM  LODGING

WHERE LODGING LIKE ‘M%’;

WHERE子句条件包括一系列值, ORACLE将通过索引范围查询的方式
查询LODGING_PK . 由于索引范围查询将返回一组值, 它的效率就
要比索引唯一扫描低一些. 

例2:

      SELECT LODGING

      FROM  LODGING

WHERE MANAGER = ‘BILL GATES’;

  这个SQL的执行分两步, LODGING$MANAGER的索引范围查询(得到所有符合
  条件记录的ROWID) 和下一步同过ROWID访问表得到LODGING列的值. 由于
  LODGING$MANAGER是一个非唯一性的索引,数据库不能对它执行索引唯一扫描. 

  由于SQL返回LODGING列,而它并不存在于LODGING$MANAGER索引中, 所以在
  索引范围查询后会执行一个通过ROWID访问表的操作. 

  WHERE子句中, 如果索引列所对应的值的第一个字符由通配符(WILDCARD)开始, 索引将不被采用.

SELECT LODGING

      FROM  LODGING

WHERE MANAGER LIKE ‘%HANMAN’;

在这种情况下,ORACLE将使用全表扫描.

27.       基础表的选择

基础表(Driving Table)是指被最先访问的表(通常以全表扫描的方式被访问).
根据优化器的不同, SQL语句中基础表的选择是不一样的.
28.       多个平等的索引

当SQL语句的执行路径可以使用分布在多个表上的多个索引时, ORACLE会同时
使用多个索引并在运行时对它们的记录进行合并, 检索出仅对全部索引有效的记录.

在ORACLE选择执行路径时,唯一性索引的等级高于非唯一性索引. 然而这个规则只有

当WHERE子句中索引列和常量比较才有效.如果索引列和其他表的索引类相比较. 这种
子句在优化器中的等级是非常低的.

如果不同表中两个想同等级的索引将被引用, FROM子句中表的顺序将决定哪个会被率
先使用. FROM子句中最后的表的索引将有最高的优先级.

如果相同表中两个想同等级的索引将被引用, WHERE子句中最先被引用的索引将有最高的优先级.

举例:

     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引.

     SELECT ENAME,

     FROM EMP

     WHERE DEPT_NO = 20

     AND EMP_CAT = ‘A’;

这里,DEPTNO索引将被最先检索,然后同EMP_CAT索引检索出的记录进行合并. 执行路径如下:

TABLE ACCESS BY ROWID ON EMP

    AND-EQUAL

        INDEX RANGE SCAN ON DEPT_IDX

        INDEX RANGE SCAN ON CAT_IDX

29.        等式比较和范围比较

     当WHERE子句中有索引列, ORACLE不能合并它们,ORACLE将用范围比较.

     举例:

     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引.

     SELECT ENAME

     FROM EMP

     WHERE DEPTNO > 20

     AND EMP_CAT = ‘A’;   

     这里只有EMP_CAT索引被用到,然后所有的记录将逐条与DEPTNO条件进行比较. 执行路径如下:

     TABLE ACCESS BY ROWID ON EMP

           INDEX RANGE SCAN ON CAT_IDX
30.       不明确的索引等级

当ORACLE无法判断索引的等级高低差别,优化器将只使用一个索引,它就是在WHERE子句中被列在最前面的.

     举例:

     DEPTNO上有一个非唯一性索引,EMP_CAT也有一个非唯一性索引.    

     SELECT ENAME

     FROM EMP

     WHERE DEPTNO > 20

     AND EMP_CAT > ‘A’;

     这里, ORACLE只用到了DEPT_NO索引. 执行路径如下:    

     TABLE ACCESS BY ROWID ON EMP

          INDEX RANGE SCAN ON DEPT_IDX
32.       避免在索引列上使用计算.

WHERE子句中,如果索引列是函数的一部分.优化器将不使用索引而使用全表扫描.

举例:

低效:

SELECT …

FROM DEPT

WHERE SAL * 12 > 25000;

高效:

SELECT …

FROM DEPT

WHERE SAL  > 25000/12;

译者按:

这是一个非常实用的规则,请务必牢记
34.       避免在索引列上使用NOT

通常, 我们要避免在索引列上使用NOT, NOT会产生在和在索引列上使用函数相同的

影响. 当ORACLE”遇到”NOT,他就会停止使用索引转而执行全表扫描.
35.       用>=替代>

如果DEPTNO上有一个索引, 

高效:

   SELECT *

   FROM EMP

   WHERE DEPTNO >=4  

   低效:

   SELECT *

   FROM EMP

   WHERE DEPTNO >3

      两者的区别在于, 前者DBMS将直接跳到第一个DEPT等于4的记录而后者将首先定
      位到DEPTNO=3 的记录并且向前扫描到第一个DEPT大于3的记录.
分享到:
评论

相关推荐

    大数据量高并发的数据库优化.pdf

    【大数据量高并发的数据库优化】是IT领域中一个至关重要的主题,特别是在现代互联网应用和服务中,数据库的性能直接影响到用户体验和系统稳定性。本篇内容主要涵盖了数据库优化的多个方面,包括数据库结构设计、查询...

    数据库备份之见

    【数据库备份】是确保数据安全的关键环节,尤其是在企业环境中,数据的价值...对于数据库管理员而言,理解备份软件的工作原理,掌握如何在保证数据一致性和实时性的同时优化备份策略,是确保企业数据安全的重要任务。

    区分SQL数据库数据表大小之我见.doc

    ### 区分SQL数据库数据表大小之我见 在日常的数据库管理与审计工作中,了解数据库中各个数据表的大小是非常重要的。这不仅有助于优化存储空间的使用,还能帮助管理员更好地进行性能调优和资源规划。然而,在SQL ...

    PML数据库设计讨论1

    常见的数据库性能优化措施包括索引优化、缓存优化、查询优化和存储优化等。索引优化是指创建和优化数据库索引,以提高查询效率。缓存优化是指使用缓存机制,以减少数据库的读写次数。查询优化是指优化数据库查询语句...

    数据库系统概念第6版实践练习和习题的5-8章的答案(其他章见我的其他资源)

    第5章通常会涵盖关系数据模型,这是数据库中最常用的数据模型之一。在这一章,你会了解到关系的概念,如关系、元组、属性和键。答案可能涉及如何定义和操作关系,如选择(Selection)、投影(Projection)、并...

    数据库系统概念第6版实践练习和习题的13-16章的答案(其他章见我的其他资源)

    SQL优化也是本章的重点,如使用索引提升查询性能。 第15章可能涵盖了事务处理和并发控制。事务是数据库操作的基本单位,保证了数据的一致性和完整性。本章会讲解ACID属性(原子性、一致性、隔离性和持久性),以及...

    mysql面试题史上最强汇总:基础知识+性能优化+备份与恢复+ 数据库设计+数据库管理+高可用性与容灾+安全性+ 框架集成等

    MySQL 是最常用的关系型数据库管理系统之一,因此在招聘和面试过程中 MySQL 相关的问题经常会被问到。以下是 MySQL 面试题的一些分类,完整内容见压缩文件: 1. 基础知识:包括 MySQL 数据库的基本概念、SQL 命令、...

    数据库系统概念第6版实践练习和习题的22-26章的答案(其他章见我的其他资源)

    这些章节通常包括了数据库设计、关系代数、查询优化、并发控制和故障恢复等核心概念。以下是各章节可能涉及的主要知识点: **第22章:数据库设计** 在这一章,主要学习了数据库设计的基本过程,包括需求分析、概念...

    数据库30条军规

    过长的表可能会导致索引膨胀,影响查询性能,因此合理的字段数量对于优化数据库设计至关重要。 **12. 表必须有主键,例如自增主键** - **解读:** - **a)** 主键递增的方式可以提高数据行写入的性能,避免页面...

    以产品为核心打告商函媒体-数据库商函发展之我见.doc

    总结来说,这篇文档提供了以产品为核心,通过名址优化、人才专业化、技术升级和市场竞争策略,推动数据库商函业务发展的全面思路。这些策略旨在提升业务的专业性和吸引力,促进函件业务的可持续增长,为企业在激烈的...

    数据库基础练习卷-Oracle

    Oracle数据库是全球广泛使用的大型关系型数据库管理系统之一,由甲骨文公司(Oracle Corporation)开发。本练习卷主要针对Oracle数据库的基础知识进行考核,包括SQL查询语句的使用和相关问题解答。这些题目旨在帮助...

    数据一致性-分区可用性-性能——多副本强同步数据库系统实现之我见1

    数据一致性是分布式数据库系统设计中的核心议题,尤其是在不依赖共享存储的情况下。传统的RDBMS,如Oracle、MySQL...通过深入理解WAL、复制协议以及性能优化技术,开发者能够构建出更加健壮、高可用的数据库解决方案。

    php版mysql大数据库备份和恢复工具

    在原faisunSQL 4.0的基础上,针对数据备份过程中出现乱码的问题,做了优化. 增强的功能: 1.自动识别数据库版本,对于MySQL 4.1以上,备份数据时提示选择字符集. 2.导入数据时,提示原数据库编码,并自动识别. 3.增加...

    数据库设计命名规范

    设计上需满足第三范式(3NF),避免冗余,但在性能优化考量下,可适度引入冗余字段。合法的表名示例有`tb_member`、`tb_member_info`等。对于多对多关系的表,可以结合两个表的前缀命名,如用户与用户分组的关系表...

    数据库系统概念第6版实践练习和习题的17-21章的答案(其他章见我的其他资源)

    此外,查询优化是数据库性能的关键,通过选择最佳执行计划来提高查询速度,这涉及到索引的使用、连接操作的选择以及查询重写等技术。 第19章可能涵盖“事务和并发控制”。在多用户环境下,事务管理确保了数据的一致...

    Feret人脸分类数据库

    通过Feret数据库,研究者可以对比不同特征提取方法和分类算法的效果,优化识别性能。 此外,Feret数据库的标签信息对训练和验证至关重要。每个图像都与特定的个体ID关联,这使得能够构建监督学习模型。在训练阶段,...

    人脸性别识别数据库

    这个数据库可能包含大量男性和女性的照片,这些照片被精心组织为训练集和测试集,以便于研究人员和开发者评估和优化他们的模型。 首先,我们来了解一下人脸识别的基本概念。人脸识别是一种生物特征识别技术,通过...

    数据库课程设计 学生 分组 登记

    - 测试与优化:对数据库进行测试,评估性能并进行必要的优化。 通过这个课程设计,学生将深入学习数据库设计的基本原则,包括规范化理论、事务处理、并发控制和恢复机制等,同时提升解决实际问题的能力。"Database...

    大学教学数据库应用 学生教师分组登记

    【大学教学数据库应用 学生教师分组登记】 在IT领域,数据库设计是构建高效、稳定、可扩展的教育管理系统的基础。本系统专注于学生、教师、课程、分组和登记等核心元素,采用E-R图作为设计工具,结合C#编程语言和...

Global site tag (gtag.js) - Google Analytics