`
fmghbfn
  • 浏览: 7125 次
  • 性别: Icon_minigender_1
  • 来自: 北京
最近访客 更多访客>>
社区版块
存档分类
最新评论

空值对索引的影响

阅读更多

我们首先做一些测试数据:

SQL> create table t(x int, y int);

 

Table created

 

请注意,这里我对表t 做了一个唯一(联合)索 引:

SQL> create unique index t_idx on t(x,y);

 

Index created

 

SQL> insert into t values(1,1);

 

1 row inserted

 

SQL> insert into t values(1,NULL);

 

1 row inserted

 

SQL> insert into t values(NULL,1);

 

1 row inserted

 

SQL> insert into t values(NULL,NULL);

 

1 row inserted

 

SQL> commit;

 

Commit complete

 

下面我们分析一下索引:

SQL> analyze index t_idx validate structure;

 

Index analyzed

 

SQL> select name,lf_rows from index_stats;

 

NAME                              LF_ROWS

------------------------------ ----------

T_IDX                                   3

 

SQL>

然后,我们就可以看到,当前的索引中仅仅保存了3 行数据。

请注意,上面我们插入并提交了四行数据。

所以,这里就有一个结论:

Oracle 的索引不保存全部为空的行。

 

 

我们继续插入数据,现在再插入几行全部为空的行:

SQL> insert into t values(NULL,NULL);

 

1 row inserted

 

SQL> insert into t values(NULL,NULL);

 

1 row inserted

我们看到这样的插入,居然没有违反前面我们设定的唯一约束(unique on t(x,y) ),

所以,这里我们又得出一个结论:

Oracle 认为 NULL<>NULL ,进而 (NULL,NULL)<>(NULL,NULL)

换句话说,Oracle 认 为空值(NULL )不等于任何值,包括空值也不等于空值。

 

我们看到下面的插入会违反唯一约束(DEMO.T_IDX) ,这个很好理解 了,因为它不是全部为空的值,即它不是(NULL,NULL ),只有全部为空的行才被认为是不同的 行:

SQL> insert into t values(1,null);

 

insert into t values(1,null)

 

ORA-00001: 违反唯一约束条件 (DEMO.T_IDX)

 

SQL> insert into t values(null,1);

 

insert into t values(null,1)

 

ORA-00001: 违反唯一约束条件 (DEMO.T_IDX)

 

SQL>

 

请看下面的例子:

SQL> select x,y,count(*) from t group by x,y;

 

    X        Y   COUNT(*)

----- -------- ----------

                         3

             1          1

    1                   1

    1        1          1

Executed in 0.03 seconds

 

SQL> select x,y,count(*) from t where x is null and y is null group by x,y;

 

   X       Y   COUNT(*)

---- ------- ----------

                       3

 

Executed in 0.01 seconds

 

SQL>

SQL> select x,y,count(*) from t group by x,y having count(*)>1;

 

     X                    Y   COUNT(*)

------ -------------------- ----------

                                     3

 

Executed in 0.02 seconds

SQL>

可以看见,完全为空的行有三行,这里我们又可以得出一个结论:

oracle group by 子 句中认为完全为空的行是相同的行

换句话说,在group by 子 句中,oracle 认为(NULL,NULL)=(NULL,NULL)

 

 

 

下面的语句,使用了复合索引(x,y )的前导列,通常这样的查询是会使用索 引的,我们看看下面的例子:

select * from t where x is null ;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE ACCESS FULL   | T           |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("T"."X" IS NULL)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.06 seconds

 

我们看到上面的查询并没有使用索引,那么对比一下不使用控制的情况:

对比一下下面的查询:

select * from t where x=1;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  INDEX RANGE SCAN    | T_IDX       |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - access("T"."X"=1)

Note: rule based optimization

 

14 rows selected

 

Executed in 0.04 seconds

这个查询(where x=1 )如我们所希望的那样使用了t_idx(x,y) 复合索引,这里我 们可以得出一个结论:

在使用IS NULL IS NOT NULL 条件的时候,Oracle 不 使用索引(因为Oracle 的索引不存储空值,详细请参见前面的相关内容)

 

那么我们如何使用空值的比较条件呢?

首先,尽量不在前导列上使用空值,请看下面的例子:

select * from t where x=1 and y is null;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |        |

|*  1 |  INDEX RANGE SCAN    | T_IDX       |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - access("T"."X"=1)

       filter("T"."Y" IS NULL)

Note: rule based optimization

 

15 rows selected

 

select * from t where x is null and y=1;

 

PLAN_TABLE_OUTPUT

--------------------------------------------------------------------------------

--------------------------------------------------------------------

| Id  | Operation            |  Name       | Rows  | Bytes | Cost  |

--------------------------------------------------------------------

|   0 | SELECT STATEMENT     |             |       |       |       |

|*  1 |  TABLE ACCESS FULL   | T           |       |       |       |

--------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

   1 - filter("T"."Y"=1 AND "T"."X" IS NULL)

Note: rule based optimization

 

14 rows selected

 

还有一个可以变通的方法,即我们在创建表的时候,为每个列都指定为非空约束(NOT NULL ),并且在必要的列上使用default 值,如:

SQL> create table lunar(

  2   c1 varchar2(10) default 'empty'

  3     constraint  c1_notnull not null,

  4   c2 number(10) default 0

  5     constraint c2_notnull not null,

  6   c3 date default to_date('20990101','yyyymmdd')

  7     constraint c3_notnull not null);

 

表已创建。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c1) values('first');

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c2) values(99);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c3) values(sysdate);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c1,c3) values('ok',sysdate);

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> insert into lunar(c2,c1) values(999,'hello');

 

已创建 1 行。

 

已用时间:  00: 00: 00.00

SQL> commit;

 

提交完成。

 

已用时间:  00: 00: 00.00

SQL> select * from lunar;

 

C1                 C2 C3

---------- ---------- ----------

first                0 01-1 -99

empty               99 01-1 -99

empty                0 19-10 -04

ok                  0 19-10 -04

hello              999 01-1 -99

 

已用时间:  00: 00: 00.00

SQL> select c1,c2,to_char(c3,'yyyy-mm-yy') from lunar;

 

C1                 C2 TO_CHAR(C3

---------- ---------- ----------

first               0 2099-01-99

empty               99 2099-01-99

empty                0 2004-10-04

ok                  0 2004-10-04

hello             999 2099-01-99

 

已用时间:  00: 00: 00.00

SQL>

然后我们再像使用一般的列那样,使用他们,并且合理的为他们建立索引相信就可以很好的提高应用的查询 效率。

分享到:
评论

相关推荐

    导致索引失效的口诀.pdf

    数据库索引是一种提高查询效率的重要手段,但是如果不正确使用索引,可能会导致索引失效,影响查询效率。以下是导致索引失效的七字口诀: 模型数空运最快嗷 1. 模:模糊查询的问题 使用like关键字进行查询的时候...

    Oracle复合索引与空值的索引使用问题小结

    本文将详细探讨Oracle如何处理含有空值的复合索引以及非空约束对索引使用的影响。 首先,我们需要了解Btree索引的基本特性。Btree索引是一种常见的数据库索引类型,它按照键值的顺序存储数据,便于快速查找。然而,...

    09 oracle的索引 PPT

    1. 空值处理:Oracle中的空值在索引中处理特殊,可能影响索引的使用。 2. 数据分布:索引性能受数据分布影响,均匀分布的数据通常比高度倾斜的数据更适合索引。 总结,Oracle的索引是提升数据库性能的关键工具,...

    书籍:Oracle与MySQL数据库索引设计与优化

    3. 避免空值索引:空值在索引中占特殊位置,可能导致索引效率下降。 4. 索引维护:定期分析和优化索引,删除无用的或低效的索引,监控索引碎片。 5. 索引使用分析:通过执行计划或查询分析工具了解查询是否有效...

    MySQL索引不会被用到的情况汇总

    MySQL中索引的类型 一般可分为四类: 普通索引:最普通的索引 唯一索引:索引列的值必须唯一,但允许有空值 主键索引:一种特殊的唯一索引,不允许有空值 联合索引:索引列有多个字段,使用时需要满足最左前缀...

    MySQL索引类型大汇总

    唯一索引与普通索引类似,唯一的区别是索引列的值必须唯一,但允许有空值。如果是组合索引,则列值的组合必须唯一。可以通过以下三种方式创建唯一索引: * 创建索引:`CREATE UNIQUE INDEX indexName ON mytable...

    数据库用索引为什么比不用索引更快

    主键索引不允许有空值,并且一个表只能有一个主键。 2. 唯一索引:与主键索引类似,它也确保索引字段的值唯一,但并不强制作为主键。 3. 普通索引(非唯一索引):允许索引字段的值重复,是最基础的索引类型。 4....

    MYSQL索引知识

    使用索引时应遵循一定的原则,如避免在频繁更新的列上创建过多索引,对常用于查询的字段建立索引,数据量小的表通常无需索引,以及在区分度高的列上建立索引等。 3. **索引的分类**: - **单列索引**:包括普通...

    主键索引与唯一索引的区别

    3、 唯一性索引列允许空值,而主键列不允许为空值。 4、 主键列在创建时,已经默认为空值 ++ 唯一索引了。 5、 一个表最多只能创建一个主键,但可以创建多个唯一索引。 6、 主键更适合那些不容易更改的唯一标识,...

    合理使用索引技巧

    - 空值(`NULL`)在索引中通常不被存储,因此`field2 IS [NOT] NULL`的查询不会利用索引。 - 不等于(`!=`)和`NOT IN`操作同样不会使用索引。 6. **多列索引的使用限制**: - 只有当查询中索引的第一列被用于条件时...

    关于MySQL面试题中有关索引的九大难点全在这里了

    oR-Tree索引: 用来对GIS数据类型创建SPATIAL索引 物理存储维度 o聚集索引:聚集索引就是以主键创建的索引,在叶子节点存储的是表中的数据。 o非聚集索引:非聚集索引就是以非主键创建的索引,在叶子节点存储的是主键...

    mysql索引与树结构(索引简介、索引用法详解、B-Tree索引结构、索引导致的问题).docx

    - **非空索引**: 确保索引列没有空值。 - **全文索引**: 专门针对全文本搜索设计。 - **按覆盖字段分类**: 单列索引与组合索引。 - **单列索引**: 针对单个列创建的索引。 - **组合索引**: 包含两个或更多列的...

    oracle索引的建立、修改、删除.doc

    空值不能被索引。只有唯一索引才真正提高速度,一般的索引只能提高 30% 左右。 语法:CREATE [unique] INDEX [user.]index ON [user.]table (column [ASC | DESC] [,column[ASC | DESC] ] ... ) [CLUSTER [schema.]...

    Oracle数据库中的索引管理技术.pdf

    B-树索引为表中的每行包含一项,除非行的索引项是空值。当使用 B-树索引时,Oracle 顺着索引节点树向下查找有查询选择条件相匹配的索引项。 (2)反向键索引 反向键索引是一种特殊类型的索引,它可以快速查找具有...

    mysql数据库以及索引详解.pptx

    - **唯一索引**:索引列的值必须是唯一的,但允许空值。 - **普通索引**:用表中的任意列构建的索引,无特殊限制。 - **全文索引**:适用于搜索大文本对象的索引。 - **组合索引**:基于多个列构建的索引,所有列值...

    ios-IOS崩溃异常的处理,防止数组越界,字典空值处理.zip

    标题提到的“iOS崩溃异常的处理,防止数组越界,字典空值处理”是一个关键的话题,它涉及到Swift或Objective-C编程中的常见错误处理策略。在这个场景下,我们主要关注的是如何避免因数组越界访问和字典空值引用导致...

    13.sql.server.2005.索引 13.sql.server.2005.索引

    综上所述,理解并合理运用SQL Server 2005的索引特性,能够显著提升数据库的查询性能,同时需要注意其对写操作的影响和存储成本。在实际应用中,需结合具体业务场景,通过试验和监控来调整和优化索引策略。

    oracle中的空值技巧[参考].pdf

    6. **空值索引**:索引可能不包含空值,因此在设计索引时要考虑空值的处理,避免影响性能。 理解并正确处理Oracle中的空值对于编写有效的SQL查询和确保数据的准确性是至关重要的。在软件开发过程中,良好的数据库...

Global site tag (gtag.js) - Google Analytics