`
javayestome
  • 浏览: 1052951 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

SQL养成一个好习惯是一笔财富

 
阅读更多

我们做软件开发的,大部分人都离不开跟数据库打交道,特别是erp开发的,跟数据库打交道更是频繁,存储过程动不动就是上千行,如果数据量大,人员流动大,那么我么还能保证下一段时间系统还能流畅的运行吗?我么还能保证下一个人能看懂我么的存储过程吗?那么我结合公司平时的培训和平时个人工作经验和大家分享一下,希望对大家有帮助。
  要知道SQL语句,我想我们有必要知道SQL Server查询分析器怎么执行我们的SQL语句的,我们很多人会看执行计划,或者用Profiler来监视和调优查询语句或者存储过程慢的原因,但是如果我们知道查询分析器的执行逻辑顺序,下手的时候就胸有成竹,那么下手是不是有把握点呢?
  一、查询的逻辑执行顺序
  (1) FROM left_table
  (3) join_type JOIN right_table (2) ON join_condition
  (4) WHERE where_condition
  (5) GROUP BY group_by_list
  (6) WITH {cube | rollup}
  (7) HAVING having_condition
  (8) SELECT (9) DISTINCT (11) top_specification select_list
  (9) ORDER BY order_by_list
  标准的 SQL 的解析顺序为:
  (1) FROM 子句 组装来自不同数据源的数据
  (2) WHERE 子句 基于指定的条件对记录进行筛选
  (3) GROUP BY 子句 将数据划分为多个分组
  (4) 使用聚合函数进行计算
  (5) 使用HAVING子句筛选分组
  (6) 计算所有的表达式
  (7) 使用ORDER BY对结果集进行排序
  二、执行顺序
  1. FROM:对FROM子句中前两个表执行笛卡尔积生成虚拟表vt1
  2. ON: 对vt1表应用ON筛选器只有满足 join_condition 为真的行才被插入vt2
  3. OUTER(join):如果指定了 OUTER JOIN保留表(preserved table)中未找到的行将行作为外部行添加到vt2,生成t3,如果from包含两个以上表,则对上一个联结生成的结果表和下一个表重复执行步骤和步骤直接结束。
  4. WHERE:对vt3应用 WHERE 筛选器只有使 where_condition 为true的行才被插入vt4
  5. GROUP BY:按GROUP BY子句中的列列表对vt4中的行分组生成vt5
  6. CUBE|ROLLUP:把超组(supergroups)插入vt6,生成vt6
  7. HAVING:对vt6应用HAVING筛选器只有使 having_condition 为true的组才插入vt7
  8. SELECT:处理select列表产生vt8
  9. DISTINCT:将重复的行从vt8中去除产生vt9
  10. ORDER BY:将vt9的行按order by子句中的列列表排序生成一个游标vc10
  11. TOP:从vc10的开始处选择指定数量或比例的行生成vt11 并返回调用者
  看到这里,那么用过Linq to SQL的语法有点相似啊?如果我们我们了解了SQL Server执行顺序,那么我们就接下来进一步养成日常SQL的好习惯,也就是在实现功能的同时有考虑性能的思想,数据库是能进行集合运算的工具,我们应该尽量的利用这个工具,所谓集合运算实际就是批量运算,就是尽量减少在客户端进行大数据量的循环操作,而用SQL语句或者存储过程代替。
  三、只返回需要的数据
  返回数据到客户端至少需要数据库提取数据、网络传输数据、客户端接收数据以及客户端处理数据等环节,如果返回不需要的数据,就会增加服务器、网络和客户端的无效劳动,其害处是显而易见的,避免这类事件需要注意:
  A、横向来看
  (1) 不要写SELECT * 的语句,而是选择你需要的字段。
  (2) 当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上。这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。
1
如有表table1(ID,col1)和table2(ID,col2)
1
Select A.ID, A.col1, B.col2
2
-- Select A.ID, col1, col2 –不要这么写,不利于将来程序扩展
3
from table1 A inner join table2 B on A.ID=B.ID Where …
  B、纵向来看
  (1) 合理写WHERE子句,不要写没有WHERE的SQL语句。
  (2) SELECT TOP N * -- 没有WHERE条件的用此替代。
  四、尽量少做重复的工作
  A、控制同一语句的多次执行,特别是一些基础数据的多次执行是很多程序员很少注意的。
  B、减少多次的数据转换,也许需要数据转换是设计的问题,但是减少次数是程序员可以做到的。
  C、杜绝不必要的子查询和连接表,子查询在执行计划一般解释成外连接,多余的连接表带来额外的开销。
  D、合并对同一表同一条件的多次UPDATE,比如
UPDATE EMPLOYEE SET FNAME='HAIWER'
WHERE EMP_ID=' VPA30890F'UPDATE EMPLOYEE SET LNAME='YANG'
WHERE EMP_ID=' VPA30890F'
这两个语句应该合并成以下一个语句
UPDATE EMPLOYEE SET FNAME='HAIWER',LNAME='YANG'WHERE EMP_ID=' VPA30890F'
  E、UPDATE操作不要拆成DELETE操作+INSERT操作的形式,虽然功能相同,但是性能差别是很大的。
  五、注意临时表和表变量的用
  在复杂系统中,临时表和表变量很难避免,关于临时表和表变量的用法,需要注意:
  A、如果语句很复杂,连接太多,可以考虑用临时表和表变量分步完成。
  B、如果需要多次用到一个大表的同一部分数据,考虑用临时表和表变量暂存这部分数据。
  C、如果需要综合多个表的数据,形成一个结果,可以考虑用临时表和表变量分步汇总这多个表的数据。
  D、其他情况下,应该控制临时表和表变量的使用。
  E、关于临时表和表变量的选择,很多说法是表变量在内存,速度快,应该首选表变量,但是在实际使用中发现:
  (1) 主要考虑需要放在临时表的数据量,在数据量较多的情况下,临时表的速度反而更快。
  (2) 执行时间段与预计执行时间(多长)
  F、关于临时表产生使用SELECT INTO和CREATE TABLE + INSERT INTO的选择,一般情况下:
  SELECT INTO会比CREATE TABLE + INSERT INTO的方法快很多,
  但是SELECT INTO会锁定TEMPDB的系统表SYSOBJECTS、SYSINDEXES、SYSCOLUMNS,在多用户并发环境下,容易阻塞其他进程。
  所以我的建议是,在并发系统中,尽量使用CREATE TABLE + INSERT INTO,而大数据量的单个语句使用中,使用SELECT INTO。
  六、子查询的用法
  子查询是一个 SELECT 查询,它嵌套在 SELECT、INSERT、UPDATE、DELETE 语句或其它子查询中。
  任何允许使用表达式的地方都可以使用子查询,子查询可以使我们的编程灵活多样,可以用来实现一些特殊的功能。但是在性能上,往往一个不合适的子查询用法会形成一个性能瓶颈。如果子查询的条件中使用了其外层的表的字段,这种子查询就叫作相关子查询。
  相关子查询可以用IN、NOT IN、EXISTS、NOT EXISTS引入。 关于相关子查询,应该注意:
  (1) NOT IN、NOT EXISTS的相关子查询可以改用LEFT JOIN代替写法。比如:
SELECT PUB_NAME FROM PUBLISHERS WHERE PUB_ID NOTIN (SELECT PUB_ID FROM TITLES WHERE TYPE ='BUSINESS')
  可以改写成:
SELECT A.PUB_NAME FROM PUBLISHERS A LEFTJOIN TITLES B ON B.TYPE ='BUSINESS'AND A.PUB_ID=B. PUB_ID WHERE B.PUB_ID IS NULL
  比如NOT EXISTS:
SELECT TITLE FROM TITLES
WHERE NOT EXISTS
(SELECT TITLE_ID FROM SALES WHERE TITLE_ID = TITLES.TITLE_ID)
1
可以改写成:
SELECT TITLE
FROM TITLES LEFTJOIN SALES
ON SALES.TITLE_ID = TITLES.TITLE_ID
WHERE SALES.TITLE_ID ISNULL
  2)如果保证子查询没有重复 ,IN、EXISTS的相关子查询可以用INNER JOIN 代替。比如:
SELECT PUB_NAME
FROM PUBLISHERS
WHERE PUB_ID IN
(SELECT PUB_ID
FROM TITLES
WHERE TYPE ='BUSINESS')
1
可以改写成:
SELECT A.PUB_NAME --SELECT DISTINCT A.PUB_NAME
FROM PUBLISHERS A INNERJOIN TITLES B
ON B.TYPE ='BUSINESS'AND
A.PUB_ID=B. PUB_ID
  (3) IN的相关子查询用EXISTS代替,比如:
SELECT PUB_NAME FROM PUBLISHERS
WHERE PUB_ID IN
(SELECT PUB_ID FROM TITLES WHERE TYPE ='BUSINESS')
  可以用下面语句代替:
SELECT PUB_NAME FROM PUBLISHERS WHERE EXISTS
(SELECT1FROM TITLES WHERE TYPE ='BUSINESS'AND
PUB_ID= PUBLISHERS.PUB_ID)
  4) 不要用COUNT(*)的子查询判断是否存在记录,最好用LEFT JOIN或者EXISTS,比如有人写这样的语句:
SELECT JOB_DESC FROM JOBS
WHERE (SELECTCOUNT(*) FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)=0
  应该改成:
SELECT JOBS.JOB_DESC FROM JOBS LEFTJOIN EMPLOYEE
ON EMPLOYEE.JOB_ID=JOBS.JOB_ID
WHERE EMPLOYEE.EMP_ID ISNULL
  
SELECT JOB_DESC FROM JOBS
WHERE (SELECT COUNT(*) FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)0
  应该改成:
SELECT JOB_DESC FROM JOBS
WHEREEXISTS (SELECT 1 FROM EMPLOYEE WHERE JOB_ID=JOBS.JOB_ID)
  七:尽量使用索引
  建立索引后,并不是每个查询都会使用索引,在使用索引的情况下,索引的使用效率也会有很大的差别。只要我们在查询语句中没有强制指定索引,索引的选择和使用方法是SQLSERVER的优化器自动作的选择,而它选择的根据是查询语句的条件以及相关表的统计信息,这就要求我们在写SQL语句的时候尽量使得优化器可以使用索引。为了使得优化器能高效使用索引,写语句的时候应该注意:
  (1)不要对索引字段进行运算,而要想办法做变换,比如:
SELECT ID FROM T WHERE NUM/2=100
应改为:
SELECT ID FROM T WHERE NUM=100*2

SELECT ID FROM T WHERE NUM/2=NUM1
如果NUM有索引应改为:
SELECT ID FROM T WHERE NUM=NUM1*2
如果NUM1有索引则不应该改。
  (2)发现过这样的语句:
SELECT 年,月,金额 FROM 结余表 WHERE100*年+月=2010*100+10
1
应该改为:
SELECT 年,月,金额 FROM 结余表 WHERE 年=2010 AND 月=10
  (3)不要对索引字段进行格式转换
日期字段的例子:
WHERECONVERT(VARCHAR(10), 日期字段,120)='2010-07-15'
应该改为
WHERE日期字段〉='2010-07-15'AND 日期字段'2010-07-16'

ISNULL转换的例子:
WHEREISNULL(字段,'')''应改为:WHERE字段''
WHEREISNULL(字段,'')=''不应修改
WHEREISNULL(字段,'F') ='T'应改为: WHERE字段='T'
WHEREISNULL(字段,'F')'T'不应修改
  (4) 不要对索引字段进行格式转换
WHERELEFT(NAME, 3)='ABC' 或者WHERE SUBSTRING(NAME,1, 3)='ABC'
应改为: WHERE NAME LIKE'ABC%'
日期查询的例子:
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期='2010-06-30' AND 日期 '2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')0
应改为:WHERE 日期 '2010-06-30'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期 '2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')0
应改为:WHERE 日期='2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期='2010-06-30'
  (5)不要对索引字段使用函数
WHERE LEFT(NAME, 3)='ABC' 或者WHERE SUBSTRING(NAME,1, 3)='ABC'
应改为: WHERE NAME LIKE 'ABC%'
日期查询的例子:
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期='2010-06-30'AND 日期 '2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')0
应改为:WHERE 日期 '2010-06-30'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期 '2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')0
应改为:WHERE 日期='2010-07-01'
WHEREDATEDIFF(DAY, 日期,'2010-06-30')=0
应改为:WHERE 日期='2010-06-30'
  (6)不要对索引字段进行多字段连接
比如:
WHERE FAME+'. '+LNAME='HAIWEI.YANG'

应改为:
WHERE FNAME='HAIWEI' AND LNAME='YANG'
  八:多表连接的连接条件对索引的选择有着重要的意义,所以我们在写连接条件条件的时候需要特别注意。
  A、多表连接的时候,连接条件必须写全,宁可重复,不要缺漏。
  B、连接条件尽量使用聚集索引
  C、注意ON、WHERE和HAVING部分条件的区别
  ON是最先执行, WHERE次之,HAVING最后,因为ON是先把不符合条件的记录过滤后才进行统计,它就可以减少中间运算要处理的数据,按理说应该速度是最快的,WHERE也应该比HAVING快点的,因为它过滤数据后才进行SUM,在两个表联接时才用ON的,所以在一个表的时候,就剩下WHERE跟HAVING比较了。  
1
考虑联接优先顺序:
2
(1) INNER JOIN
3
(2) LEFT JOIN (注:RIGHT JOIN 用 LEFT JOIN 替代)
4
(3) CROSS JOIN
  其它注意和了解的地方有:
  A、在IN后面值的列表中,将出现最频繁的值放在最前面,出现得最少的放在最后面,减少判断的次数。
  B、注意UNION和UNION ALL的区别。-- 允许重复数据用UNION ALL好
  C、注意使用DISTINCT,在没有必要时不要用。
  D、TRUNCATE TABLE 与 DELETE 区别。
  E、减少访问数据库的次数。
  还有就是我们写存储过程,如果比较长的话,最后用标记符标开,因为这样可读性很好,即使语句写的不怎么样,但是语句工整,C# 有region,SQL我比较喜欢用的就是:
--startof 查询在职人数
SQL语句
--end of
  正式机器上我们一般不能随便调试程序,但是很多时候程序在我们本机上没问题,但是进正式系统就有问题,但是我们又不能随便在正式机器上操作,那么怎么办呢?我们可以用回滚来调试我们的存储过程或者是SQL语句,从而排错。
BEGINTRAN
UPDATE a SET 字段=''
ROLLBACK
  作业存储过程我一般会加上下面这段,这样检查错误可以放在存储过程,如果执行错误回滚操作,但是如果程序里面已经有了事务回滚,那么存储过程就不要写事务了,这样会导致事务回滚嵌套降低执行效率,但是我们很多时候可以把检查放在存储过程里,这样有利于我们解读这个存储过程,和排错。
BEGINTRANSACTION
--事务回滚开始

--检查报错
IF ( @@ERROR0 )
BEGIN
--回滚操作
ROLLBACKTRANSACTION
RAISERROR('删除工作报告错误', 16, 3)
RETURN
END

--结束事务
COMMITTRANSACTION

11
14
分享到:
评论
3 楼 wangfulong 2011-09-30  
刚刚有测试了一下 返回的结果集一样 但是exists执行的时间短
2 楼 wangfulong 2011-09-30  
 比如NOT EXISTS:
SELECT TITLE FROM TITLES
WHERE NOT EXISTS
(SELECT TITLE_ID FROM SALES WHERE TITLE_ID = TITLES.TITLE_ID)
1
可以改写成:
SELECT TITLE
FROM TITLES LEFTJOIN SALES
ON SALES.TITLE_ID = TITLES.TITLE_ID
WHERE SALES.TITLE_ID ISNULL
我实验了一下 这两个语句返回的结果集不一样 NOT EXISTS返回的结果集要比LEFTJOIN的少

你的理想状态应该是没有重复值的吧
1 楼 k1280000 2011-09-30  
转走了。。。。。。。。。

相关推荐

    养成良好的sql习惯

    ### 养成良好的SQL习惯:优化查询与提升效率的关键 在IT行业中,SQL(Structured Query Language)作为数据库管理的核心语言,其使用习惯的好坏直接影响着数据处理的效率、准确性和系统的响应速度。养成良好的SQL...

    SQLServer中如何将一个字段的多个记录值合在一行显示

    SQLServer 中将一个字段的多个记录值合并到一行显示的实现方法 SQL Server 是一种关系型数据库管理系统,具有强大的数据处理能力和存储能力。在实际应用中,我们经常需要将一个字段的多个记录值合并到一行显示,以...

    要养成良好的书写SQL的习惯共12页.pdf.zip

    以下是关于“要养成良好的书写SQL的习惯”的详细讲解: 1. **清晰的逻辑结构**:在编写SQL时,应保持语句结构清晰,使用适当的缩进和空格,使得其他人阅读时能轻松理解其逻辑层次。 2. **避免冗余**:减少重复的...

    SQL 语法 SQL 总结 SQL教程

    SQL 基础 SQL 首页 SQL 简介 SQL 语法 SQL select SQL distinct SQL where SQL AND & OR SQL Order By SQL insert SQL update SQL delete SQL 高级 SQL Top SQL Like SQL 通配符 SQL In SQL Between ...

    带SQL注入的一个ASP网站源码

    这是一个很好的学习机会,可以帮助你理解SQL注入的工作原理,提高代码安全性。你可以尝试构造不同的SQL注入 payload,观察它们如何影响数据库,并学习如何编写防御代码。 总的来说,通过研究这个带有SQL注入的ASP...

    sql server 导入超大SQL脚本文件

    osql 是 SQL Server 提供的一个命令行工具,用于执行 SQL 语句和运行 SQL 脚本文件。osql 工具可以在命令行下执行 SQL 语句,非常适合批量执行 SQL 任务。 如何使用 osql 导入超大 SQL 脚本文件? 在 SQL Server ...

    sqlserver自动生成sql语句工具sqlserver转oracle

    市场上存在许多这样的工具,如SSMA(SQL Server Migration Assistant) for Oracle,这是一个官方提供的迁移工具,能自动分析SQL Server的架构,并生成适合Oracle的DDL(Data Definition Language)和DML(Data ...

    SQLPrompt for SQLServer2016 智能提示插件 SQL2016 提示

    SQLPrompt for SQLServer2016 智能提示插件 SQL2016 提示 SQL...将SQL代码封装成一个存储好的程序 扩展通配符 拆分表格 浏览数据库 查找无效的数据库对象 从查询语句中直接将对象改编为ALTER 找到未使用的变量和参数

    C# 版SQL美化解析器源码项目

    1. `english.dic`:可能是一个英语词汇库,可能用于帮助生成更符合英文习惯的SQL查询输出,或者用于错误消息的本地化。 2. `gsqlparser_developer_License.txt`:通常包含软件的开发许可协议,详细规定了用户可以...

    SQL脚本文件合并工具

    通过“SQL脚本文件合并工具”,我们可以将分散的SQL脚本整合到一起,形成一个大的SQL脚本文件,这样在SQL*Plus中只需要运行一次,就能完成所有脚本的执行,避免了反复打开、执行单个文件的繁琐步骤。 合并过程可能...

    kettle链接SQL server驱动 sqljdbc

    2. 创建一个新的数据库连接或者编辑已有的连接。 3. 在“类型”下拉菜单中选择“Microsoft SQL Server”或“Microsoft SQL Server (JDBC)”。 4. 填写“主机名/地址”、“端口”、“数据库名”、“用户名”和“密码...

    SqlServer连接工具

    首先,SQL Server Management Studio (SSMS) 是微软官方提供的一个全面的集成环境,专为管理和开发SQL Server设计。它包含了对SQL Server实例的各种管理工具,例如对象资源管理器,用于浏览和操作数据库、表、存储...

    Oracle Sql语句转换成Mysql Sql语句

    当需要将一个基于Oracle SQL的应用程序迁移到MySQL环境时,就需要进行SQL语句的转换工作。本项目提供了一个Java源码工具,能够帮助用户便捷地将Oracle SQL语句转换为MySQL SQL语句。 Oracle SQL与MySQL SQL的主要...

    Java打印漂亮的SQL语句(被格式化的SQL语句)

    总的来说,Java打印漂亮的SQL语句是一个提高开发效率和代码质量的有效方法,通过使用如"PrettySQLFormatter"这样的工具,可以使得复杂的SQL查询变得更容易理解和维护,这对于大型项目或者涉及大量SQL操作的开发工作...

    SQLMonitor oracle跟踪SQL工具

    《SQLMonitor:Oracle数据库SQL跟踪与分析利器》 在IT行业中,数据库的高效管理与优化是至关重要的。...在掌握并熟练运用SQLMonitor后,我们就能更好地驾驭Oracle数据库,实现高效的数据管理和应用开发。

    SQL语句一键美化工具

    2. `sqlpp.chm`:这是一个Windows的帮助文件,很可能包含了关于SQLPP(可能是指SQL美化工具的名字)的详细使用指南和参考资料,用户可以通过它来学习如何操作和定制工具的各项功能。 3. `english.dic`:这可能是一...

    EditPlus 支持 SQL 语法高亮配置文件 sql.stx

    市面上能找到很多资料,我看了接近十份,全部都是一个叫 KK 之人制作的同一个文件。此文件没有区分各种关键字的不同,而且竟然将双引号认定为字符串包括符。于是我重写了一份 sql.stx 文件,改善了发现的上述问题。 ...

    win8 64位安装sql 2005无法启动sql server服务问题

    (补丁可以网上下载,是一个exe格式的可执行文件,实际上就是一个更新软件包,也可叫补丁,只是叫法不一样)。 通过以上六个步骤基本可以解决问题。没有解决的可能是当前登录不是超级管理员导致的。

    SQL语句基础教程

    在SQL中,表格是一个数据库内的结构,用于储存资料。表格处理是SQL的重要组成部分,包括: * 创建表格:CREATE TABLE * 删除表格:DROP TABLE * 修改表格:ALTER TABLE 进阶SQL -------- 进阶SQL是SQL的高级话题...

    SQL2005桌面版

    在安装SQL2005桌面版之前,用户必须先确保系统已经安装了.NET Framework 2.0,这是一个由微软开发的软件框架,用于提供运行和执行.NET应用程序所需的基础环境。 SQL Server 2005的核心组件包括数据库引擎、Analysis...

Global site tag (gtag.js) - Google Analytics