`
tomcat_oracle
  • 浏览: 317444 次
社区版块
存档分类
最新评论

Java开发者写SQL时常犯的10个错误

阅读更多
1、不用PreparedStatements
  有意思的是,在JDBC出现了许多年后的今天,这个错误依然出现在博客、论坛和邮件列表中,即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个:
  他们对PreparedStatements不了解
  他们认为使用PreparedStatements太慢了
  他们认为写PreparedStatements太费力
  来吧,我们来破除上面的谣言。96%的案例中,用PreparedStatement比静态声明语句更好。为什么呢?就是下面这些简单的原因:
  使用内联绑定值(inlining bind values)可以从源头上避免糟糕的语句引起语法错误。
  使用内联绑定值可以避免糟糕的语句引起的SQL注入漏洞。
  当插入更多“复杂的”数据类型(比如时间戳、二进制数据等等)时,可以避免边缘现象(edge-cases)。
  你若保持PreparedStatements的连接开启状态而不马上关闭,只要重新绑定新值就可以进行复用。
  你可以在更多复杂的数据库里使用adaptive cursor sharing——自适应游标共享(Oracle的说法)。这可以帮你在每次新设定绑定值时阻止SQL语句硬解析。
  (译者注:硬解析的弊端。硬解析即整个SQL语句的执行需要完完全全的解析,生成执行计划。而硬解析,生成执行计划需要耗用CPU资源,以及SGA资源。在此不得不提的是对库缓存中 闩的使用。闩是锁的细化,可以理解为是一种轻量级的串行化设备。当进程申请到闩后,则这些闩用于保护共享内存的数在同一时刻不会被两个以上的进程修改。在 硬解析时,需要申请闩的使用,而闩的数量在有限的情况下需要等待。大量的闩的使用由此造成需要使用闩的进程排队越频繁,性能则逾低下)
  某些特殊情况下你需要对值进行内联绑定,这是为了给基于成本的性能优化器提示该查询将要涉及的数据集。典型的情况是用“常量”判断:
  DELETED = 1
  STATUS = 42
  而不应该用一个“变量”判断:
  FIRST_NAME LIKE “Jon%”
  AMOUNT > 19.95
  要注意的是,现代数据库已经实现了绑定数据窥探(bind-variable peeking)。因此,默认情况下,你也可以为你所有的查询参数使用绑定值。在你写嵌入的JPQL或嵌入的SQL时,用JPA CriteriaQuery或者jOOQ这类高层次的API可以很容易也很清晰的帮你生成PreparedStatements语句并绑定值。
  更多的背景资料:
  绑定数据窥探(bind-variable peeking)的附加说明:这个主题有一篇有趣的文章,它出自Oracle大师Tanel Poder之手。
  游标分享。StackOverflow上一个有趣的问题。
  解决方案:
  默认情况下,总是使用PreparedStatements来代替静态声明语句,而永远不要在你的SQL语句嵌入内联绑定值。
  2、返回太多列
  这个错误发生的非常频繁,它不光会影响你的数据库执行计划,也会对你的Java应用造成不好的影响。让我们先看看对后者的影响:
  对Java程序的不良影响:
  如 果你为了满足不同DAO层之间的数据复用而select *或者默认的50个列,这样将会有大量的数据从数据库读入到JDBC结果集中,即使你不从结果集读取数据,它也被传递到了线路上并被JDBC驱动器加载到 了内存中。如果你知道你只需要2-3列数据的话,这就造成了严重的IO和内存的浪费。
  这个(问题的严重性)都是显而易见的,要小心……
  对数据库执行计划的不良影响:
  这 些影响事实上可能比对Java应用的影响还要严重。当复杂的数据库要针对你的查询请求计算出最佳执行计划时,它会进行大量的SQL转换(SQL transformation )。还好,请求中的一部分可以被略去,因为它们对SQL连映射或过滤条件起不了什么作用。我最近写了一篇博客来讲述这个问题:元数据模式会对Oracle查询转换产生怎样的影响。
  现在,给你展示一个错误的例子。想一想有两个视图的复杂查询:
  SELECT *
  FROM  customer_view c
  JOIN  order_view o
  ON  c.cust_id = o.cust_id
  每个关联了上述关联表引用的视图也可能再次关联其他表的数据,像 CUSTOMER_ADDRESS、ORDER_HISTORY、ORDER_SETTLEMENT等等。进行select * 映射时,你的数据库除了把所有连接表都加载进来以外别无选择,实际上,你唯一感兴趣的数据可能只有这些:
  SELECT c.first_name, c.last_name, o.amount
  FROM  customer_view c
  JOIN  order_view o
  ON  c.cust_id = o.cust_id
  一个好的数据库会在转换你的SQL语句时自动移除那些不需要的连接,这样数据库就只需要较少的IO和内存消耗。
  解决方案:
  永远不要用select *(这样的查询)。也不要在执行不同请求时复用相同的映射。尽量尝试减少映射到你所真正需要的数据。
  需要注意的是,想在对象-关系映射(ORMs)上达成这个目标有些难。3、把JOIN当做了SELECT的子句
  对于性能或SQL语句的正确性来说,这不算错。但是不管如何,SQL开发者应该意识到JOIN子句不是SELECT语句的一部分。SQL standard 1992 定义了表引用:
6.3 <table reference>
<table reference> ::=
<table name> [ [ AS ] <correlation name>
[ <left paren> <derived column list> <right paren> ] ]
| <derived table> [ AS ] <correlation name>
[ <left paren> <derived column list> <right paren> ]
| <joined table>
7.4 <from clause>
<from clause> ::=
FROM <table reference> [ { <comma> <table reference> }... ]
7.5 <joined table>
<joined table> ::=
<cross join>
| <qualified join>
| <left paren> <joined table> <right paren>
<cross join> ::=
<table reference> CROSS JOIN <table reference>
<qualified join> ::=
<table reference> [ NATURAL ] [ <join type> ] JOIN
<table reference> [ <join specification> ]
  关联数据库是以表为中心的。许多的操作的某方面都是执行在物理表、连接表或派生表上的。为了有效的写出SQL语句,理解SELECT … FROM子句是以“,”分割表引用是非常重要的。
  基于表引用(table references)的复杂性,一些数据库也接受其它类型的复杂的表引用(table references),像INSERT、UPDATE、DELETE、MERGE。看看Oracle实例手册,里面解释了如何创建可更新的视图。
  解决方案:
  一定要考虑到,一般说来,FROM子句也是一个表引用(table references)。如果你写了JOIN子句,要考虑这个JOIN子句是这个复杂的表引用的一部分:
  SELECT c.first_name, c.last_name, o.amount
  FROMcustomer_view c
  JOIN order_view o
  ON c.cust_id = o.cust_id
  4、使用ANSI 92标准之前连接语法
  我 们已经说清了表引用是怎么工作的(看上一节),因此我们应该达成共识,不论花费什么代价,都应该避免使用ANSI 92标准之前的语法。就执行计划而言,使用JOIN…ON子句或者WHERE子句来作连接谓语没有什么不同。但从可读性和可维护性的角度看,在过滤条 件判断和连接判断中用WHERE子句会陷入不可自拔的泥沼,看看这个简单的例子:
  SELECT c.first_name, c.last_name, o.amount
  FROM  customer_view c,
  order_view o
  WHERE  o.amount > 100
  AND    c.cust_id = o.cust_id
  AND    c.language = 'en'
  你能找到join谓词么?如果我们加入数十张表呢?当你使用外连接专有语法的时候会变得更糟,就像Oracle的(+)语法里讲的一样。
  解决方案:
  一定要用ANSI 92标准的JOIN语句。不要把JOIN谓词放到WHERE子句中。用ANSI 92标准之前的JOIN语法没有半点好处。
  5、使用LIKE判定时忘了ESCAPE
  SQL standard 1992 指出like判定应该如下:
  8.5 <like predicate>
  <like predicate> ::=
  <match value> [ NOT ] LIKE <pattern>
  [ ESCAPE <escape character> ]
  当允许用户对你的SQL查询进行参数输入时,就应该使用ESCAPE关键字。尽管数据中含有百分号(%)的情况很罕见,但下划线(_)还是很常见的:
  SELECT *
  FROM  t
  WHERE  t.x LIKE 'some!_prefix%' ESCAPE '!'
  解决方案:
  使用LIKE判定时,也要使用合适的ESCAPE
6、认为 NOT (A IN (X, Y)) 和 IN (X, Y) 的布尔值相反
  对于NULLs,这是一个举足轻重的细节!让我们看看 A IN (X, Y) 真正意思吧:
  A IN (X, Y)
  is the same as    A = ANY (X, Y)
  is the same as    A = X OR A = Y
  When at the same time, NOT (A IN (X, Y)) really means:
  同样的,NOT (A IN (X, Y))的真正意思:
  NOT (A IN (X, Y))
  is the same as    A NOT IN (X, Y)
  is the same as    A != ANY (X, Y)
  is the same as    A != X AND A != Y
  看起来和之前说的布尔值相反一样?其实不是。如果X或Y中任何一个为NULL,NOT IN 条件产生的结果将是UNKNOWN,但是IN条件可能依然会返回一个布尔值。
  或者换种说话,当 A IN (X, Y) 结果为TRUE或FALSE时,NOT(A IN (X, Y)) 结果为依然UNKNOWN而不是FALSE或TRUE。注意了,如果IN条件的右边是一个子查询,结果依旧。
  不信?你自己看SQL Fiddle 去。它说了如下查询给不出结果:
  SELECT 1
  WHERE    1 IN (NULL)
  UNION ALL
  SELECT 2
  WHERE NOT(1 IN (NULL))
  更多细节可以参考我的上一篇博客,上面写了在同区域内不兼容的一些SQL方言。
  解决方案:
  当涉及到可为NULL的列时,注意NOT IN条件。
  7、认为NOT (A IS NULL)和A IS NOT NULL是一样的
  没错,我们记得处理NULL值的时候,SQL实现了三值逻辑。这就是我们能用NULL条件来检测NULL值的原因。对么?没错。
  但在NULL条件容易遗漏的情况下。要意识到下面这两个条件仅仅在行值表达式(row value expressions)为1的时候才相等:
  NOT (A IS NULL)
  is not the same as A IS NOT NULL
  如果A是一个大于1的行值表达式(row value expressions),正确的表将按照如下方式转换:
  如果A的所有值为NUll,A IS NULL为TRUE
  如果A的所有值为NUll,NOT(A IS NULL) 为FALSE
  如果A的所有值都不是NUll,A IS NOT NULL 为TRUE
  如果A的所有值都不是NUll,NOT(A IS NOT NULL)  为FALSE
  在我的上一篇博客可以了解到更多细节。
  解决方案:
  当使用行值表达式(row value expressions)时,要注意NULL条件不一定能达到预期的效果。
  8、不用行值表达式
  行值表达式是SQL一个很棒的特性。SQL是一个以表格为中心的语言,表格又是以行为中心。通过创建能在同等级或行类型进行比较的点对点行模型,行值表达式让你能更容易的描述复杂的判定条件。一个简单的例子是,同时请求客户的姓名
  SELECT c.address
  FROM  customer c,
  WHERE (c.first_name, c.last_name) = (?, ?)
  可以看出,就将每行的谓词左边和与之对应的右边比较这个语法而言,行值表达式的语法更加简洁。特别是在有许多独立条件通过AND连接的时候就特别有效。行值表达式允许你将相互联系的条件放在一起。对于有外键的JOIN表达式来说,它更有用:
  SELECT c.first_name, c.last_name, a.street
  FROM  customer c
  JOIN  address a
  ON  (c.id, c.tenant_id) = (a.id, a.tenant_id)
  不幸的是,并不是所有数据库都支持行值表达式。但SQL标准已经在1992对行值表达式进行了定义,如果你使用他们,像Oracle或Postgres这些的复杂数据库可以使用它们计算出更好的执行计划。在Use The Index, Luke这个页面上有解析。
  解决方案:
  不管干什么都可以使用行值表达式。它们会让你的SQL语句更加简洁高效。
  9、不定义足够的限制条件(constraints)
  我又要再次引用Tom Kyte 和 Use The Index, Luke 了。对你的元数据使用限制条件不能更赞了。首先,限制条件可以帮你防止数据质变,光这一点就很有用。但对我来说更重要的是,限制条件可以帮助数据库进行SQL语句转换,数据库可以决定。
  哪些值是等价的
  哪些子句是冗余的
  哪些子句是无效的(例如,会返回空值的语句)
  有些开发者可能认为限制条件会导致(数据库)变慢。但相反,除非你插入大量的数据,对于大型操作是你可以禁用限制条件,或用一个无限制条件的临时“载入表”,线下再把数据转移到真实的表中。
  解决方案:
  尽可能定义足够多的限制条件(constraints)。它们将帮你更好的执行数据库请求。
  10、认为50ms是一个快的查询速度
  NoSQL的炒作依然在继续,许多公司认为它们像Twitter或Facebook一样需要更快、扩展性更好的解决方案,想脱离ACID和关系模型横向扩展。有些可能会成功(比如Twitter或Facebook),而其他的也许会走入误区
  对于那些仍被迫(或坚持)使用关系型数据 库的公司,请不要自欺欺人的认为:“现在的关系型数据库很慢,其实它们是被天花乱坠的宣传弄快的”。实际上,它们真的很快,解析20Kb查询文档,计算 2000行执行计划,如此庞大的执行,所需时间小于1ms,如果你和数据管理员(DBA)继续优化调整数据库,就能得到最大限度的运行。
  它们会变慢的原因有两种:一是你的应用滥用流行的ORM;二是ORM无法针对你复杂的查询逻辑产生快的SQL语句。遇到这种情况,你就要考虑选择像 JDBC、jOOQ 或MyBatis这样的更贴近SQL核心,能更好的控制你的SQL语句的API。
  因此,不要认为查询速度50ms是很快或者可以接受的。完全不是!如果你程序运行时间是这样的,请检查你的执行计划。这种潜在危险可能会在你执行更复杂的上下文或数据中爆发。
3
0
分享到:
评论

相关推荐

    Java 程序员在写 SQL 时常犯的 10 个错误

    以下是根据标题和描述中提到的几点,对Java程序员在SQL编程中常犯错误的详细解析: 1. 忽视NULL的特殊性 NULL在SQL中的含义是未知,与Java中的null不同。Java程序员经常混淆这两个概念,尤其是在使用NULL作为比较...

    10种Java开发者编写SQL语句时常见错误

    Java开发者在编写SQL语句时,常常会遇到一些由于对SQL特性和面向对象编程思维的不适应而导致的常见错误。以下是对这些错误的详细解析: 1. **误解NULL的含义**: SQL中的NULL并不等同于Java中的null,它们在逻辑上...

    Java开发的sql生成器

    为了解决这个问题,Java开发的SQL生成器应运而生。这种工具能够根据程序员的需求自动创建SQL语句,提高了开发效率并减少了错误的可能性。 首先,我们来理解SQL生成器的核心功能。SQL生成器通常包含以下几个关键模块...

    Java程序员在写SQL程序时候常犯的10个错误_.docx

    有些Java开发者倾向于将SQL查询结果加载到内存中进行处理,尤其是复杂的数据分析和计算。然而,数据库通常提供了更高效的支持,如窗口函数、分组计算等。利用数据库的OLAP功能可以提高性能并减少内存压力。建议优先...

    java检查sql语法是否正确

    为了实现这一目标,开发者通常会利用Java的JDBC(Java Database Connectivity)API或者其他第三方库来执行预编译或解析SQL语句。下面我们将详细探讨如何在Java中检查SQL语法的正确性。 首先,JDBC API提供了一个`...

    SQL2JAVA-java字段串代码拼接小工具

    标题中的“SQL2JAVA-java字段串代码...通过提供直观的用户界面,使得开发者能够快速高效地在Java代码和SQL语句之间进行切换,提升开发效率,减少错误。对于熟悉Java和SQL的开发者来说,这是一款非常有价值的辅助工具。

    图书馆管理系统java+SQL

    综上所述,"图书馆管理系统java+SQL"项目涵盖了Java编程、SQL数据库操作、数据库设计、业务逻辑实现、用户界面设计等多个方面的知识,是学习和实践软件开发的宝贵实例。通过这样的系统开发,开发者可以提升自身的...

    JavaSwing图书管理系统SQL server数据库

    具体到这个图书管理系统,开发者可能使用了`java.sql.Connection`、`java.sql.Statement`、`java.sql.ResultSet`等类。例如,使用`Connection`对象的`createStatement()`方法创建一个`Statement`,然后调用`...

    SQL转Java代码小工具

    总的来说,这个“SQL转Java代码小工具”是Java开发者的实用助手,能够简化SQL在Java应用程序中的集成,提高开发效率,减少错误,并保持代码整洁。对于那些频繁处理SQL的Java开发者,尤其使用Hibernate的项目,这是一...

    java-连接SQL测试

    `java-连接SQL测试`这个程序就是实现这一功能的一个实例,它通过编写Java代码来建立和管理与SQL Server数据库的连接。`ConnSQL.java`是这个程序的核心文件,其中包含了实现数据库连接逻辑的Java代码。 首先,我们要...

    java连接sql2005包

    总之,这个压缩包提供了一套完整的解决方案,让Java开发者能够方便地连接到SQL Server 2005数据库,进行数据操作。无论是通过标准的JDBC API还是JSTL,都能大大提高开发效率。在实际应用中,还需要考虑错误处理、...

    图书管理系统+Java源代码+SQL Server数据库文件

    《图书管理系统:基于Java与SQL Server的实现》 图书管理系统是一种常见的信息管理软件,它能够...通过深入研究这个系统,开发者可以提升自己在软件工程实践中的能力,尤其是对Java编程和SQL Server数据库运用的理解。

    java连接sqlserver数据库示例以及jar包

    总的来说,通过理解和实践这个示例,开发者可以掌握Java连接SQL Server数据库的基本步骤,从而实现数据的读写操作。在实际项目中,可能还需要考虑更多因素,如连接池管理、事务控制等,这些都是更高级的JDBC应用。

    JAVA+sqlserver数据库酒店管理系统

    开发者利用JAVA的JDBC(Java Database Connectivity)接口与SQLServer2000建立连接,执行SQL语句来实现数据的增删查改。通过合理的设计数据库表结构,如客房表、客户表、预订表等,可以确保数据的一致性和完整性。 ...

    java驱动SQLDriver

    首先,JDBC是Java平台的标准接口,它提供了一组API,使得Java开发者能够以统一的方式处理各种数据库。JDBC驱动主要有四种类型:Type 1、Type 2、Type 3和Type 4。SQL Server Driver通常属于Type 4,即纯Java的、完全...

    Java SQL server 数据库备份

    综上所述,Java与SQL Server数据库备份涉及多个层面,包括理解SQL Server的备份机制、使用JDBC与数据库交互、设计备份策略、处理错误以及保障数据安全。熟练掌握这些知识点将有助于构建可靠的数据库备份解决方案。

    java+sql项目

    在本Java+SQL实训项目中,我们关注的核心是利用JSP(Java Server Pages)技术和SQL数据库来构建一个机票购买系统。这个系统旨在提供一个安全、稳定的服务,让用户能够方便地在线购买机票。以下是对该项目各个方面的...

    sql server 2000 java驱动包

    SQL Server 2000 Java驱动包是针对Java开发者设计的,主要用于在Java应用程序中连接和操作Microsoft SQL Server 2000数据库。这个驱动包提供了必要的接口和类,使得Java程序员可以使用JDBC(Java Database ...

Global site tag (gtag.js) - Google Analytics