`
jxd_zxf
  • 浏览: 231889 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

Java性能优化之——Java代码优化过程的实例介绍

    博客分类:
  • Java
阅读更多

Java代码优化过程的实例介绍

        通过笔者经历的一个项目实例,本文介绍了 Java 代码优化的过程,总结了优化 Java 程序的一些最佳实践,分析了进行优化的方法,并解释了性能提升的原因。从多个角度分析导致性能低的原因,并逐个进行优化,最终使得程序的性能得到极大提升,代码的可读性、可扩展性更强。

 

一、衡量程序的标准

        衡量一个程序是否优质,可以从多个角度进行分析。其中,最常见的衡量标准是程序的时间复杂度、空间复杂度,以及代码的可读性、可扩展性。针对程序的时间复杂度和空间复杂度,想要优化程序代码,需要对数据结构与算法有深入的理解,并且熟悉计算机系统的基本概念和原理;而针对代码的可读性和可扩展性,想要优化程序代码,需要深入理解软件架构设计,熟知并会应用合适的设计模式。

        首先,如今计算机系统的存储空间已经足够大了,达到了 TB 级别,因此相比于空间复杂度,时间复杂度是程序员首要考虑的因素。为了追求高性能,在某些频繁操作执行时,甚至可以考虑用空间换取时间。

        其次,由于受到处理器制造工艺的物理限制、成本限制,CPU 主频的增长遇到了瓶颈,摩尔定律已渐渐失效,每隔 18 个月 CPU 主频即翻倍的时代已经过去了,程序员的编程方式发生了彻底的改变。在目前这个多核多处理器的时代,涌现了原生支持多线程的语言(如 Java)以及分布式并行计算框架(如 Hadoop)。为了使程序充分地利用多核 CPU,简单地实现一个单线程的程序是远远不够的,程序员需要能够编写出并发或者并行的多线程程序。

        最后,大型软件系统的代码行数达到了百万级,如果没有一个设计良好的软件架构,想在已有代码的基础上进行开发,开发代价和维护成本是无法想象的。一个设计良好的软件应该具有可读性和可扩展性,遵循“开闭原则”、“依赖倒置原则”、“面向接口编程”等。

 

二、项目介绍

        本文将介绍笔者经历的一个项目中的一部分,通过这个实例剖析代码优化的过程。下面简要地介绍该系统的相关部分。

        该系统的开发语言为 Java,部署在共拥有 4 核 CPU 的 Linux 服务器上,相关部分主要有以下操作:通过某外部系统 D 提供的 REST API 获取信息,从中提取出有效的信息,并通过 JDBC 存储到某数据库系统 S 中,供系统其他部分使用,上述操作的执行频率为每天一次,一般在午夜当系统空闲时定时执行。为了实现高可用性(High Availability),外部系统 D 部署在两台服务器上,因此需要分别从这两台服务器上获取信息并将信息插入数据库中,有效信息的条数达到了上千条,数据库插入操作次数则为有效信息条数的两倍。

 

图 1. 系统体系结构图

图 1. 系统体系结构图

        为了快速地实现预期效果,在最初的实现中优先考虑了功能的实现,而未考虑系统性能和代码可读性等。系统大致有以下的实现:(1)REST API 获取信息、数据库操作可能抛出的异常信息都被记录到日志文件中,作为调试用;(2)共有 5 次数据库连接操作,包括第一次清空数据库表,针对两个外部系统 D 各有两次数据库插入操作,这 5 个连接都是独立的,用完之后即释放;(3)所有的数据库插入语句都是使用 java.sql.Statement 类生成的;(4)所有的数据库插入语句,都是单条执行的,即生成一条执行一条;(5)整个过程都是在单个线程中执行的,包括数据库表清空操作,数据库插入操作,释放数据库连接;(6)数据库插入操作的 JDBC 代码散布在代码中。虽然这个版本的系统可以正常运行,达到了预期的效果,但是效率很低,从通过 REST API 获取信息,到解析并提取有效信息,再到数据库插入操作,总共耗时 100 秒左右。而预期的时间应该在一分钟以内,这显然是不符合要求的。

 

三、代码优化过程

        笔者开始分析整个过程有哪些耗时操作,以及如何提升效率,缩短程序执行的时间。通过 REST API 获取信息,因为是使用外部系统提供的 API,所以无法在此处提升效率;取得信息之后解析出有效部分,因为是对特定格式的信息进行解析,所以也无效率提升的空间。所以,效率可以大幅度提升的空间在数据库操作部分以及程序控制部分。下面,分条叙述对耗时操作的改进方法。

 

四、针对日志记录的优化

        关闭日志记录,或者更改日志输出级别。因为从两台服务器的外部系统 D 上获取到的信息是相同的,所以数据库插入操作会抛出异常,异常信息类似于“Attempt to insert duplicate record”,这样的异常信息跟有效信息的条数相等,有上千条。这种情况是能预料到的,所以可以考虑关闭日志记录,或者不关闭日志记录而是更改日志输出级别,只记录严重级别(severe level)的错误信息,并将此类操作的日志级别调整为警告级别(warning level),这样就不会记录以上异常信息了。本项目使用的是 Java 自带的日志记录类,以下配置文件将日志输出级别设置为严重级别。

        清单 1. log.properties 设置日志输出级别的片段

 # default file output is in user ’ s home directory.  
  1. # levels can be: SEVERE, WARNING, INFO, FINE, FINER, FINEST
  2. java.util.logging.ConsoleHandler.level=SEVERE
  3. javajava.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
  4. java.util.logging.FileHandler.append=true

        通过上述的优化之后,性能有了大幅度的提升,从原来的 100 秒左右降到了 50 秒左右。为什么仅仅不记录日志就能有如此大幅度的性能提升呢?查阅资料,发现已经有人做了相关的研究与实验。经常听到 Java 程序比 C/C++ 程序慢的言论,但是运行速度慢的真正原因是什么,估计很多人并不清楚。对于 CPU 密集型的程序(即程序中包含大量计算),Java 程序可以达到 C/C++ 程序同等级别的速度,但是对于 I/O 密集型的程序(即程序中包含大量 I/O 操作),Java 程序的速度就远远慢于 C/C++ 程序了,很大程度上是因为 C/C++ 程序能直接访问底层的存储设备。因此,不记录日志而得到大幅度性能提升的原因是,Java 程序的 I/O 操作较慢,是一个很耗时的操作。

 

五、针对数据库连接的优化

        共享数据库连接。共有 5 次数据库连接操作,每次都需重新建立数据库连接,数据库插入操作完成之后又立即释放了,数据库连接没有被复用。为了做到共享数据库连接,可以通过单例模式(Singleton Pattern)获得一个相同的数据库连接,每次数据库连接操作都共享这个数据库连接。这里没有使用数据库连接池(Database Connection Pool)是因为在程序只有少量的数据库连接操作,只有在大量并发数据库连接的时候才需要连接池。

        清单 2. 共享数据库连接的代码片段

  1. public class JdbcUtil {
  2. private static Connection con;
  3. // 从配置文件读取连接数据库的信息
  4. private static String driverClassName;
  5. private static String url;
  6. private static String username;
  7. private static String password;
  8. private static String currentSchema;
  9. private static Properties properties = new Properties();
  10. static {
  11. // driverClassName, url, username, password, currentSchema 等从配置文件读取,代码略去
  12. try {
  13. Class.forName(driverClassName);
  14. } catch (ClassNotFoundException e) {
  15. e.printStackTrace();
  16. }
  17. properties.setProperty("user", username);
  18. properties.setProperty("password", password);
  19. properties.setProperty("currentSchema", currentSchema);
  20. try {
  21. con = DriverManager.getConnection(url, properties);
  22. } catch (SQLException e) {
  23. e.printStackTrace();
  24. }
  25. }
  26. private JdbcUtil() {}
  27. // 获得一个单例的、共享的数据库连接
  28. public static Connection getConnection() {
  29. return con;
  30. }
  31. public static void close() throws SQLException {
  32. if (con != null)
  33. con.close();
  34. }
  35. }

        通过上述的优化之后,性能有了小幅度的提升,从 50 秒左右降到了 40 秒左右。共享数据库连接而得到的性能提升的原因是,数据库连接是一个耗时耗资源的操作,需要同远程计算机进行网络通信,建立 TCP 连接,还需要维护连接状态表,建立数据缓冲区。如果共享数据库连接,则只需要进行一次数据库连接操作,省去了多次重新建立数据库连接的时间。

 

  • 针对插入数据库记录的优化 1

        使用预编译 SQL。具体做法是使用 java.sql.PreparedStatement 代替 java.sql.Statement 生成 SQL 语句。PreparedStatement 使得数据库预先编译好 SQL 语句,可以传入参数。而 Statement 生成的 SQL 语句在每次提交时,数据库都需进行编译。在执行大量类似的 SQL 语句时,可以使用 PreparedStatement 提高执行效率。使用 PreparedStatement 的另一个好处是不需要拼接 SQL 语句,代码的可读性更强。通过上述的优化之后,性能有了小幅度的提升,从 40 秒左右降到了 30~35 秒左右。

 

        清单 3. 使用 Statement 的代码片段

// 需要拼接 SQL 语句,执行效率不高,代码可读性不强 
  1. StringBuilder sql = new StringBuilder();
  2. sql.append("insert into table1(column1,column2) values('");
  3. sql.append(column1Value);
  4. sql.append("','");
  5. sql.append(column2Value);
  6. sql.append("');");
  7. Statement st;
  8. try {
  9. st = con.createStatement();
  10. st.executeUpdate(sql.toString());
  11. } catch (SQLException e) {
  12. e.printStackTrace();
  13. }

清单 4. 使用 PreparedStatement 的代码片段

 // 预编译 SQL 语句,执行效率高,可读性强 
  1. String sql = “insert into table1(column1,column2) values(?,?)”;
  2. PreparedStatement pst = con.prepareStatement(sql);
  3. pst.setString(1,column1Value);
  4. pst.setString(2,column2Value);
  5. pst.execute();

 

  • 针对插入数据库记录的优化 2

        使用 SQL 批处理。通过 java.sql.PreparedStatement 的 addBatch 方法将 SQL 语句加入到批处理,这样在调用 execute 方法时,就会一次性地执行 SQL 批处理,而不是逐条执行。通过上述的优化之后,性能有了小幅度的提升,从 30~35 秒左右降到了 30 秒左右。

 

六、针对多线程的优化

        使用多线程实现并发 / 并行。清空数据库表的操作、把从 2 个外部系统 D 取得的数据插入数据库记录的操作,是相互独立的任务,可以给每个任务分配一个线程执行。清空数据库表的操作应该先于数据库插入操作完成,可以通过 java.lang.Thread 类的 join 方法控制线程执行的先后次序。在单核 CPU 时代,操作系统中某一时刻只有一个线程在运行,通过进程 / 线程调度,给每个线程分配一小段执行的时间片,可以实现多个进程 / 线程的并发(concurrent)执行。而在目前的多核多处理器背景下,操作系统中同一时刻可以有多个线程并行(parallel)执行,大大地提高了计算速度。

 

清单 5. 使用多线程的代码片段

  1. Thread t0 = new Thread(new ClearTableTask());
  2. Thread t1 = new Thread(new StoreServersTask(ADDRESS1));
  3. Thread t2 = new Thread(new StoreServersTask(ADDRESS2));
  4. try {
  5. t0.start();
  6. // 执行完清空操作后,再进行后续操作
  7. t0.join();
  8. t1.start();
  9. t2.start();
  10. t1.join();
  11. t2.join();
  12. } catch (InterruptedException e) {
  13. e.printStackTrace();
  14. }
  15. // 断开数据库连接
  16. try {
  17. JdbcUtil.close();
  18. } catch (SQLException e) {
  19. e.printStackTrace();
  20. }

        通过上述的优化之后,性能有了大幅度的提升,从 30 秒左右降到了 15 秒以下,10~15 秒之间。使用多线程而得到的性能提升的原因是,系统部署所在的服务器是多核多处理器的,使用多线程,给每个任务分配一个线程执行,可以充分地利用 CPU 计算资源。

        笔者试着给每个任务分配两个线程执行,希望能使程序运行得更快,但是事与愿违,此时程序运行的时间反而比每个任务分配一个线程执行的慢,大约 20 秒。笔者推测,这是因为线程较多(相对于 CPU 的内核数),使得 CPU 忙于线程的上下文切换,过多的线程上下文切换使得程序的性能反而不如之前。因此,要根据实际的硬件环境,给任务分配适量的线程执行。

 

七、针对设计模式的优化

        使用 DAO 模式抽象出数据访问层。原来的代码中混杂着 JDBC 操作数据库的代码,代码结构显得十分凌乱。使用 DAO 模式(Data Access Object Pattern)可以抽象出数据访问层,这样使得程序可以独立于不同的数据库,即便访问数据库的代码发生了改变,上层调用数据访问的代码无需改变。并且程序员可以摆脱单调繁琐的数据库代码的编写,专注于业务逻辑层面的代码的开发。通过上述的优化之后,性能并未有提升,但是代码的可读性、可扩展性大大地提高了。

图 2. DAO 模式的层次结构

 

图 2. DAO 模式的层次结构

 

清单 6. 使用 DAO 模式的代码片段

  1. // DeviceDAO.java,定义了 DAO 抽象,上层的业务逻辑代码引用该接口,面向接口编程
  2. public interface DeviceDAO {
  3. public void add(Device device);
  4. }
  5. // DeviceDAOImpl.java,DAO 实现,具体的 SQL 语句和数据库操作由该类实现
  6. public class DeviceDAOImpl implements DeviceDAO {
  7. private Connection con;
  8. public DeviceDAOImpl() {
  9. // 获得数据库连接,代码略去
  10. }
  11. @Override
  12. public void add(Device device) {
  13. // 使用 PreparedStatement 进行数据库插入记录操作,代码略去
  14. }
  15. }

 

        回顾以上代码优化过程:关闭日志记录、共享数据库连接、使用预编译 SQL、使用 SQL 批处理、使用多线程实现并发 / 并行、使用 DAO 模式抽象出数据访问层,程序运行时间从最初的 100 秒左右降低到 15 秒以下,在性能上得到了很大的提升,同时也具有了更好的可读性和可扩展性。

 

八、结束语

        通过该项目实例,笔者深深地感到,想要写出一个性能优化、可读性可扩展性强的程序,需要对计算机系统的基本概念、原理,编程语言的特性,软件系统架构设计都有较深入的理解。“纸上得来终觉浅,绝知此事要躬行”,想要将这些基本理论、编程技巧融会贯通,还需要不断地实践,并总结心得体会。

 

原文链接:http://www.ibm.com/developerworks/cn/java/j-lo-codeoptimize/

分享到:
评论

相关推荐

    java课程设计实例——java源代码

    在这个“java课程设计实例——java源代码”压缩包中,我们很可能会找到一系列的Java源码文件,这些文件可能涵盖了各种Java编程的基础到高级概念。 首先,"ch01"这个文件名可能是章节的标识,暗示了这个压缩包可能...

    神经网络算法与实现 ——基于Java语言 代码实例

    《神经网络算法与实现——基于Java语言 代码实例》是一本深入探讨神经网络编程的书籍,专注于使用Java语言实现各种神经网络模型。本书通过实际的代码示例,为读者提供了理解神经网络工作原理以及如何在Java环境下...

    java初学者适用——java实例大全

    【Java初学者适用——Java实例大全】是一份专为初学者设计的教程资源,它涵盖了大量实际编程案例,旨在帮助新手快速掌握Java编程语言。在Java的世界里,实践是掌握知识的关键,通过实例学习能够更好地理解和应用理论...

    为性能而设计——JAVA

    【标题】:“为性能而设计——JAVA” 【描述】:文章探讨了在JAVA编程中,如何在设计阶段就考虑到性能优化,强调了性能管理应从项目初期开始,并指出类设计对性能的影响。 【标签】:性能、JAVA 【正文】: 在...

    java实例——闹钟——看看吧 总有思路的

    总的来说,通过这个“java实例——闹钟”,我们可以深入了解Java的定时器机制,这对于开发各种需要定时触发功能的应用(如定时备份、自动检查更新等)非常有用。不断练习和理解这些基础知识,将有助于提升你在Java...

    Java大学简明教程——实例程序设计

    Java大学简明教程——实例程序设计是一本专为初学者设计的编程教材,它通过丰富的实例来引导读者深入理解Java编程语言。这本书的核心目标是帮助新手快速掌握Java的基础概念和编程技巧,从而能够独立地进行程序设计。...

    基于Java的局域网通信——飞鸽传书源代码.zip

    在本项目中,"基于Java的局域网通信——飞鸽传书源代码.zip" 提供了一种使用Java实现的局域网内文件传输的解决方案,类似于传统的“飞鸽传书”方式。这个项目旨在帮助开发者理解如何在Java环境下利用网络编程技术...

    实战Java虚拟机——JVM故障诊断与性能优化

    理解这些部分的工作方式有助于定位问题和优化性能。 2. **内存管理**:JVM内存主要分为堆内存和栈内存,其中堆内存用于对象实例的存储,栈内存则处理方法调用。了解内存分配、GC(Garbage Collection)策略以及内存...

    Java源码包100个设计实例.zip

    Java局域网通信——飞鸽传书源代码.rar JAVA帮助视图组件库 Help GUI 1.1源代码.rar JAVA开发的打字软件源程序.rar Java开发的简单WEB服务器源码.rar Java数据压缩与传输实例 Java数组倒置 Java日期选择控件完整源...

    基于java的局域网通信——飞鸽传书源代码.zip

    本项目“基于Java的局域网通信——飞鸽传书源代码”提供了一种实现这一功能的方法,特别适用于学习和理解网络编程。通过分析这个项目的源代码,我们可以深入学习Java网络编程的基础知识,以及如何利用Java实现文件...

    深入体验Java Web开发内幕——核心基础

    Spring MVC是Java Web中最受欢迎的MVC框架之一,提供了强大的依赖注入、AOP(面向切面编程)等功能。 五、Java EE容器 Java EE容器如Tomcat、Jetty、Glassfish等,它们负责管理Web应用的生命周期,提供Servlet和JSP...

    Java面试之——代码与编程题

    【Java面试之——代码与编程题】是Java程序员在求职过程中常常遇到的面试环节,主要考察应聘者对Java语言的理解和实际操作能力。面试中,面试官可能会提出各种类型的编程题目,包括但不限于设计模式、继承机制、内部...

    java的课程设计——聊天器 有代码和论文

    Java课程设计——聊天器是一种基于Java的网络编程技术实现的通信工具,旨在提供一个实时、交互式的交流平台。在这个项目中,我们将深入探讨Java的Socket编程、多线程以及数据序列化等关键技术。 首先,Java的Socket...

    java基础——————试题库

    这份“java基础——————试题库”资源旨在帮助学习者系统地复习和深入理解Java的基础知识,确保他们能够全方位地掌握这一强大的编程工具。下面将详细阐述Java的基础知识点。 1. **Java简介** - Java是由Sun ...

    JAVA图形界面程序——汉诺塔演示程序代码

    ### JAVA图形界面程序——汉诺塔演示程序代码 #### 概述 本篇文章将详细介绍一个用Java语言编写的汉诺塔问题的图形界面演示程序。汉诺塔问题是一种经典的递归算法实例,常用于教授递归思想。在这个程序中,我们将...

    java生成静态页面——Freemarker实例教程.docx

    ### Java生成静态页面——Freemarker实例教程 #### 一、Freemarker简介 Freemarker是一款基于模板的通用工具,它可以嵌入到各种应用程序中,帮助开发者将动态数据渲染成HTML、XML或其他文本格式的文件。对于提高...

    java web项目案例——知识管理软件

    本篇文章将详细介绍 Java Web 项目案例——知识管理软件的相关知识点,涵盖 Java EE 概述、Servlet 基础、JSP、JSTL、JavaBean、Hibernate 等技术。 一、Java EE 概述 Java EE(Enterprise Edition)是一个基于 ...

    java课件——全面介绍java知识

    这个"java课件——全面介绍java知识"中,你将找到关于这些主题的详细讲解,配合源代码学习,可以帮助你更好地理解理论并付诸实践,提升编程技能。无论是对于初级开发者还是有一定经验的程序员,这套课件都将是一份...

Global site tag (gtag.js) - Google Analytics