in 和 exists的区别用数据说话

全部 Linux 数据库敏捷编程数据结构软件测试项目管理 Oracle 编程综合互联网 Erlang MySQL

浏览 44069 次

锁定老帖子主题：in 和 exists的区别用数据说话该帖已经被评为良好帖
作者	正文
jinnianshilongnian 等级: 性别: 文章: 1112 积分: 2290	发表时间：2012-05-03 最后修改：2012-05-04 相关推荐: in和exists的区别，用数据说话 Oracle中的in和exists区别 SQL优化之子查询-IN和EXISTS哪个快点语音和噪声相关数据集(持续更新) about云大数据面试宝典大公司面试一般用不到更多相关推荐数据库 1、环境操作系统：winxp系统 cpu：p8700 双核2.53 内存：2GB 数据库：oracle9i 2、表结构 sql代码： drop table base_customer; create table base_customer ( uuid number(10) not null, customerId varchar(20), showName varchar(30), trueName varchar(30), image varchar(100), pwd varchar(50), registerTime timestamp, securityKey varchar(10), primary key (uuid), unique(customerId) ); create index idx_customer_registerTime on base_customer(registerTime); drop table base_customer_sign; create table base_customer_sign ( uuid number(10) not null, signCustomerUuid number(10) not null, signTime timestamp not null, signCount number(10) not null, signSequenceCount number(10) not null, primary key (uuid) ); create index idx_sign on base_customer_sign(signCustomerUuid); 3、索引及数据量 sql代码： base_customer 100w条 uuid主键 customerId 唯一索引 base_customer_sign 100条 uuid主键 signCustomerUuid 非唯一索引 4、初始化数据用例 java代码： import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.Timestamp; import java.util.Date; import oracle.jdbc.OracleDriver; public class Test { public static void main(String[] args) throws Exception { initData(); } public static void initData() throws Exception { DriverManager.registerDriver(new OracleDriver()); Connection conn = null; try { String url = "jdbc:oracle:thin:@localhost:1521:orcl2"; String username = "test"; String password = "test"; conn = DriverManager.getConnection(url, username, password); conn.setAutoCommit(false); conn.createStatement().execute("truncate table base_customer"); PreparedStatement psst = conn.prepareStatement("insert into base_customer values(?,?,?,?,?,?,?,?)"); for(int i=1; i<=1000000;i++) {//100w int count = 1; psst.setInt(count++, i); psst.setString(count++, "user" + i); psst.setString(count++, "user" + i); psst.setString(count++, "user" + i); psst.setString(count++, "user" + i); psst.setString(count++, "user" + i); psst.setTimestamp(count++, new Timestamp(System.currentTimeMillis())); psst.setString(count++, "key" + i); psst.addBatch(); psst.executeBatch(); conn.commit(); } PreparedStatement psst2 = conn.prepareStatement("insert into base_customer_sign values(?,?,?,?,?)"); for(int i=1; i<=100;i++) {//100 int count = 1; psst2.setInt(count++, i); psst2.setInt(count++, i); psst2.setTimestamp(count++, new Timestamp(System.currentTimeMillis())); psst2.setInt(count++, 1); psst2.setInt(count++, 1); psst2.addBatch(); psst2.executeBatch(); conn.commit(); } psst.close(); conn.commit(); } catch (Exception e) { e.printStackTrace(); conn.rollback(); } finally { conn.close(); } } } 5、场景 5.1、第一组内表大外表小用例1、 sql代码： select count() from base_customer_sign where signCustomerUuid in (select uuid from base_customer where trueName like 'user%') 执行计划：* 如图1-1 执行时间： 0.015秒结论：数据库执行了优化，根本不是我们需要的用例。用例2 java代码： select count() from base_customer_sign where signCustomerUuid in (select uuid from base_customer where trueName like 'user%' group by uuid) 执行计划：* 如图1-2 执行时间： 28.672秒结论：内表如果查询回来很多数据并要排序的话，效率很极低，因此内表适合返回数据量小的表，例外是用例1场景。用例3 java代码： select count() from base_customer_sign where exists (select 1 from base_customer where trueName like 'user%' and base_customer.uuid = base_customer_sign.signCustomerUuid) 执行计划：* 如图1-3 执行时间： 0.016秒结论：外表执行全扫描，如果外表大很降低效率。用例4 java代码： select count() from base_customer_sign where signCustomerUuid in (select uuid from base_customer where customerId like 'user%') 执行计划：* 如图1-4 执行时间： 13.61秒结论：即使内表很小，但外表数据量很大同样是低效。用例5 java代码： select count() from base_customer_sign where exists (select 1 from base_customer where base_customer.customerId like 'user%' and base_customer.uuid = base_customer_sign.signCustomerUuid) 执行计划：* 如图1-5 执行时间： 0．032秒结论：内表大，外表小，速度快。第二组内表小外表大用例6 java代码： select * from base_customer where uuid in (select signCustomerUuid from base_customer_sign where trueName like 'user%') 执行计划：如图1-6 执行时间： 3.844秒结论：外表全扫描，慢。用例7 java代码： select count() from base_customer where exists (select 1 from base_customer_sign where trueName like 'user%' and base_customer.uuid = base_customer_sign.signCustomerUuid) 执行计划：* 如图1-7 执行时间： 3.828秒结论：和用例6一样。用例8 java代码： select count() from base_customer where uuid in (select signCustomerUuid from base_customer_sign where uuid>1 and signSequenceCount < 1) 执行计划：* 如图1-8 执行时间： 0.031秒结论：sql被优化，使用base_customer_sign作为外表，而且和内表是通过连接搞定，效率快。用例9 java代码： select count() from base_customer where exists (select 1 from base_customer_sign where base_customer_sign.uuid>1 and base_customer.uuid = base_customer_sign.signCustomerUuid) 执行计划：* 如图1-9 执行时间： 3.531秒结论：外表全表扫描快不了。总结： 1、 in可能被优化为连接 2、 in 在未被优化时，外表小，内表大时（要建临时表并排序耗时）效率低 3、 exists 外表数据量大，速度肯定慢，，即使是in同样一样，而对于内表数据量多少跟索引有关。 4、 in 和 exists 在外表返回的数据量很大时也是低效的。因此，，外表（驱动表）应该都尽可能的小。 5、 not in 不走索引的，因此不能用 6、 not exists走索引的。自己总结，难免有纰漏本人只测试以上9个简单的用例，复杂场景可能未考虑到，因此在调优时应该会看执行计划，根据执行计划决定哪个是高效的。 http://sishuok.com/forum/posts/list/1154.html 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

string2020 等级: 初级会员性别: 文章: 203 积分: 40 来自: 广州	发表时间：2012-05-04 很好，很好，本王很看好此贴。
返回顶楼	回帖地址 0 0 请登录后投票

jinnianshilongnian 等级: 性别: 文章: 1112 积分: 2290	发表时间：2012-05-04 string2020 写道很好，很好，本王很看好此贴。谢谢，我是做JEE开发的，对数据库理解不是不深，有错误希望指正
返回顶楼	回帖地址 1 0 请登录后投票

liu_dou 等级: 初级会员文章: 4 积分: 60	发表时间：2012-05-04 jinnianshilongnian 写道 string2020 写道很好，很好，本王很看好此贴。谢谢，我是做JEE开发的，对数据库理解不是不深，有错误希望指正老大太谦虚了。。。。
返回顶楼	回帖地址 0 0 请登录后投票

Jclick 等级: 性别: 文章: 102 积分: 100 来自: 北京	发表时间：2012-05-04 很不错啊。。现在这么详细的帖子很少见了。。。
返回顶楼	回帖地址 0 0 请登录后投票

jinnianshilongnian 等级: 性别: 文章: 1112 积分: 2290	发表时间：2012-05-04 Jclick 写道很不错啊。。现在这么详细的帖子很少见了。。。再接再厉，
返回顶楼	回帖地址 0 0 请登录后投票

inter12 等级: 初级会员性别: 文章: 40 积分: 60 来自: 杭州	发表时间：2012-05-04 简单的说 in 是先内表，后外表，exist是先外表，后内表。几个判断依据： 1.是否存在排序，排序都是耗资源的 2.是否走索引
返回顶楼	回帖地址 0 0 请登录后投票

chinaagan 等级: 初级会员性别: 文章: 44 积分: 30 来自: 重庆	发表时间：2012-05-04 顶一个，用数据说话。
返回顶楼	回帖地址 0 0 请登录后投票

king520 等级: 初级会员性别: 文章: 34 积分: 40 来自: 合肥	发表时间：2012-05-04 第二个循环的时候，不是100次笔误啦呵呵
返回顶楼	回帖地址 0 0 请登录后投票

jinnianshilongnian 等级: 性别: 文章: 1112 积分: 2290	发表时间：2012-05-04 king520 写道第二个循环的时候，不是100次笔误啦呵呵谢谢啊
返回顶楼	回帖地址 0 0 请登录后投票

« 上一页 1 2 3 4 5 6 下一页 »

论坛首页 → 综合技术版

跳转论坛:

in 和 exists的区别 用数据说话

in 和 exists的区别用数据说话