Java程序员编程时需要混合面向对象思维和一般命令式编程的方法,能否完美的将两者结合起来完全得依靠编程人员的水准:
技能(任何人都能容易学会命令式编程)
模式(有些人用“模式-模式”,举个例子,模式可以应用到任何地方,而且都可以归为某一类模式)
心境(首先,要写个好的面向对象程序是比命令式程序难的多,你得花费一些功夫)
但当Java程序员写SQL语句时,一切都不一样了。SQL是说明性语言而非面向对象或是命令式编程语言。在SQL中要写个查询语句是很简单的。但在Java里类似的语句却不容易,因为程序员不仅要反复考虑编程范式,而且也要考虑算法的问题。
下面是Java程序员在写SQL时常犯的错误(没有特定的顺序):
1.忘掉NULL
Java程序员写SQL时对NULL的误解可能是最大的错误。也许是因为(并非唯一理由)NULL也称作UNKNOWN。如果被称作UNKNOWN,这还好理解些。另一个原因是,当你从数据库拿东西或是绑定变量时,JDBC将SQL NULL 和Java中的null对应了起来。这样导致了NULL = NULL(SQL)和null=null(Java)的误解。
对于NULL最大的误解是当NULL被用作行值表达式完整性约束条件时。
另一个误解出现在对于NULL 在 NOT IN anti-joins的应用中。
解决方法:
好好的训练你自己。当你写SQL时要不停得想到NULL的用法:
这个NULL完整性约束条件是正确的?
NULL是否影响到结果?
2.在Java内存中处理数据
很少有Java开发者能将SQL理解的很好.偶尔使用的JOIN,还有古怪的UNION,好吧.但是对于窗口函数呢?还有对集合进行分组呢?许多的Java开发者将SQL数据加载到内存中,将这些数据转换成某些相近的集合类型,然后再那些集合上面使用边界循环控制结构(至少在Java8的集合升级以前)执行令人生厌的数学运算.
但是一些SQL数据库支持先进的(而且是SQL标准支持的!)OLAP特性,这一特性表现更好而且写起来也更加方便.一个(并不怎么标准的)例子就是Oracle超棒的MODEL分句.只让数据库来做处理然后只把结果带到Java内存中吧.因为毕竟所有非常聪明的家伙已经对这些昂贵的产品进行了优化.因此实际上,通过将OLAP移到数据库,你将获得一下两项好处:
便利性.这比在Java中编写正确的SQL可能更加的容易.
性能表现.数据库应该比你的算法处理起来更加快.而且更加重要的是,你不必再去传递数百万条记录了.
完善的方法:
每次你使用Java实现一个以数据为中心的算法时,问问自己:有没有一种方法可以让数据库代替为我做这种麻烦事.
3. 使用UNION代替UNION ALL
太可耻了,和UNION相比UNION ALL还需要额外的关键字。如果SQL标准已经规定了支持,那么可能会更好点。
UNION(允许重复)
UNION DISTINCT (去除了重复)
移除重复行不仅很少需要(有时甚至是错的),而且对于带很多行的大数据集合会相当慢,因为两个子select需要排序,而且每个元组也需要和它的子序列元组比较。
注意即使SQL标准规定了INTERSECT ALL和EXCEPT ALL,很少数据库会实现这些没用的集合操作符。
处理方法:
每次你写UNION语句时,考虑实际上是否需要UNION ALL语句。
4.通过JDBC分页技术给大量的结果进行分页操作
大部分的数据库都会支持一些分页命令实现分页效果,譬如LIMIT..OFFSET,TOP..START AT,OFFSET..FETCH语句等。即使没有支持这些语句的数据库,仍有可能对ROWNUM(甲骨文)或者是ROW NUMBER() OVER()过滤(DB2,SQL Server2008等),这些比在内存中实现分页更快速。在处理大量数据中,效果尤其明显。
纠正:
仅仅使用这些语句,那么一个工具(例如JOOQ)就可以模拟这些语句的操作。
5.在java内存中加入数据
从SQL的初期开始,当在SQL中使用JOIN语句时,一些开发者仍旧有不安的感觉。这是源自对加入JOIN后会变慢的固有恐惧。假如基于成本的优化选择去实现嵌套循环,在创建一张连接表源前,可能加载所有的表在数据库内存中,这可能是真的。但是这事发生的概率太低了。通过合适的预测,约束和索引,合并连接和哈希连接的操作都是相当的快。这完全是是关于正确元数据(在这里我不能够引用Tom Kyte的太多)。而且,可能仍然有不少的Java开发人员加载两张表通过分开查询到一个映射中,并且在某种程度上把他们加到了内存当中。
纠正:
假如你在各个步骤中有从各种表的查询操作,好好想想是否可以表达你的查询操作在单条语句中。
6.在一个临时的笛卡尔积集合中使用 DISTINCT 或 UNION 消除重复项
通过复杂的连接,人们可能会对SQL语句中扮演关键角色的所有关系失去概念。特别的,如果这涉及到多列外键关系的话,很有可能会忘记在JOIN .. ON子句中增加相关的判断。这会导致重复的记录,但或许只是在特殊的情况下。有些开发者因此可能选择DISTINCT来消除这些重复记录。从三个方面来说这是错误的:
它(也许)解决了表面症状但并没有解决问题。它也有可能无法解决极端情况下的症状。
对具有很多列的庞大的结果集合来说它很慢。DISTINCT要执行ORDER BY操作来消除重复。
对庞大的笛卡尔积集合来说它很慢,还是需要加载很多的数据到内存中。
解决方法:
根据经验,如果你获得了不需要的重复记录,还是检查你的JOIN判断吧。可能在某个地方有一个很难觉察的笛卡尔积集合。
7. 不使用MERGE语句
这并不是一个过失,但是可能是缺少知识或者对于强悍的MERGE语句信心不足。一些数据库理解其它形式的更新插入(UPSERT)语句, 如 MYSQL的重复主键更新语句,但是MERGE在数据库中确是很强大,很重要,以至于大肆扩展SQL标准,例如SQL SERVER。
解决之道:
如果你使用像联合INSERT和UPDATE或者联合SELECT .. FOR UPDATE然后在INSERT或UPDATE等更新插入时,请三思。你完全可以使用一个更简单的MERGE语句来远离冒险竞争条件。
8. 使用聚合函数代替窗口函数(window functions)
在介绍窗口函数之前,在SQL中聚合数据意味着使用GROUP BY语句与聚合函数相映射。在很多情形下都工作得很好,如聚合数据需要浓缩常规数据,那么就在join子查询中使用group查询。
但是在SQL:2003中定义了窗口函数,这个在很多主流数据库都实现了它。窗口函数能够在结果集上聚合数据,但是却没有分组。事实上,每个窗口函数都有自己的、独立的PARTITION BY语句,这个工具对于显示报告太TM好了。
使用窗口函数:
使SQL更易读(但在子查询中没有GROUP BY语句专业)
提升性能,像关系数据库管理系统能够更容易优化窗口函数
解决方法:
当你在子查询中使用GROUP BY语句时,请再三考虑是否可以使用窗口函数完成。
9. 使用内存间接排序
SQL的ORDER BY语句支持很多类型的表达式,包括CASE语句,对于间接排序十分有用。你可能重来不会在Java内存中排序数据,因为你会想:
SQL排序很慢
SQL排序办不到
处理方法:
如果你在内存中排序任何SQL数据,请再三考虑,是否不能在数据库中排序。这对于数据库分页数据十分有用。
10. 一条一条的插入大量纪录
JDBC ”懂“批处理(batch),你应该不会忘了它。不要使用INSERT语句来一条一条的出入成千上万的记录,(因为)每次都会创建一个新的PreparedStatement对象。如果你的所有记录都插入到同一个表时,那么就创建一个带有一条SQL语句以及附带很多值集合的插入批处理语句。你可能需要在达到一定量的插入记录后才提交来保证UNDO日志瘦小,这依赖于你的数据库和数据库设置。
处理方法:
总是使用批处理插入大量数据。
分享到:
相关推荐
本文将针对Java程序员容易犯的10个错误进行详细讲解,帮助大家避免这些陷阱。 1. **Array 转 ArrayList**: 当使用`Arrays.asList()`方法将数组转换为列表时,返回的是`java.util.Arrays.ArrayList`,这是一个内部...
JAVA程序员必需搞懂的问题,描述一些Java程序员需注意的问题一些容易犯的错误。
JAVA是有SUN公司开发的新一代编程语言,它可以用在各种不同的机器、操作系统的网络环境中...所以作为Internet应用的开发技术人员不可不看JAVA,而JAVA程序不可不先从基础学起,这正是JAVA程序员必读:基础篇的用意。
【Java程序最容易犯的21种错误】是一个关于Java编程中常见问题的总结,这些问题可能导致代码质量下降,可维护性和可扩展性降低。以下是对这些错误的详细解释: 1. **重复代码(Duplicated Code)**:代码重复是降低...
### 写Java程序最容易犯的错误例析 在软件开发过程中,编写高质量的代码是非常重要的。良好的代码不仅能提高系统的可维护性和可扩展性,还能减少未来的维护成本。本文将详细介绍编写Java程序时最常见的21个错误,并...
Java程序员在编写SQL程序时,由于SQL语言的特性和与Java的差异,常常会遇到一些常见错误。以下是对这些错误的详细分析和解决方案: 1. 忘记处理NULL值 NULL在SQL中的处理方式与Java中不同,容易引发混淆。Java中的...
"Java程序员容易犯的10大低级错误" 本文总结了Java程序员容易犯的10大低级错误,旨在帮助开发人员避免这些错误,提高编程质量。下面是这10个错误的详细解释: 1. 不能用“==”比较两个字符串内容相等 在Java中,...
以下是对这些最容易犯的21种错误的详细解释: 1. **重复代码 (Duplicated Code)** - 在多个地方存在相同或几乎相同的代码段,这违反了DRY(Don't Repeat Yourself)原则,应通过提取公共方法或模块化设计来避免。 ...
Java编程中,程序员可能会遇到各种常见错误,这些错误不仅影响代码质量,还可能导致软件的可维护性和可扩展性降低。以下是对标题和描述中提到的21种常见错误的详细解释: 1. **重复代码(Duplicated Code)**:当相同...
【Java程序员容易犯的10个SQL错误】这篇文章聚焦于Java开发者在编写SQL语句时常见的误区,这些错误可能导致程序的不稳定或者效率低下。以下是详细分析: 1. **忽视NULL的特殊性**:Java程序员经常对SQL中的NULL值...
以下是Java程序员常犯的五个错误的详细解析,以及如何避免这些错误的建议。 1. **过度使用 null** 在Java中,null 常常被用来表示“无”或“不存在”,但过度依赖null可能导致NullPointerException。当方法返回...
介绍了java程序员在写程序的时候容易犯的10种错误
标题“全世界所有程序员都会犯的错误”暗示了这是一篇面向广大程序员的文章,旨在揭示在编程过程中容易出现的普遍性错误。这种错误具有广泛的适用性和警示意义,对于提高编程质量、减少bug有重要的参考价值。 #### ...
java学习第一天,讲解java是什么 本章学习要点 了解 Java 语言的版本及特点 了解学习 Java 的方法 掌握 JDK 的安装 掌握环境变量的配置 熟悉 Java 程序的编写、编译和运行过程 ...15.Java程序员学习路线
Java编程语言以其强大的功能和广泛的应用领域而深受程序员喜爱,然而,即使是经验丰富的开发者也可能在编写Java代码时遇到一些常见的陷阱和误区。本篇将详细探讨"Java习题(一些不注意就犯的错误)"中涉及的知识点,...
### 用Java语言编写程序最容易犯的21种错误 #### 1. 代码重复 (Duplicated Code) 在软件开发过程中,代码重复是最常见的问题之一。这种现象通常来源于程序员使用复制粘贴的方式来快速构建功能,这导致代码库中存在...
面试者最容易犯的10个错误不要因为这些常见的错误而与成功失之交臂。要了解面试者常犯的一些错误,学会如何避免这些问题。面试准备的若干策略不要因为沉溺在无穷无尽的面试题中而错过了最重要的求职建议。这些策略和...
程序员往往容易犯的一个错误就是默认所有用户输入都是安全可靠的,这会导致一系列的安全问题,比如缓冲区溢出、跨站点脚本攻击(XSS)、SQL注入等。 - **缓冲区溢出**:当攻击者提供的数据长度超过应用程序所能处理...
在Java编程中,"BUG模式"通常指的是程序员在编写代码时容易犯的一些常见错误或陷阱,这些错误可能导致程序运行不正常、性能下降甚至系统崩溃。理解并避免这些BUG模式是提高Java程序质量和效率的关键。本篇文章将深入...