衡量一个程序是否优质,可以从多个角度进行分析。其中,最常见的衡量标准是程序的时间复杂度、空间复杂度,以及代码的可读性、可扩展性。针对程序的时间复杂度和空间复杂度,想要优化程序代码,需要对数据结构与算法有深入的理解,并且熟悉计算机系统的基本概念和原理;而针对代码的可读性和可扩展性,想要优化程序代码,需要深入理解软件架构设计,熟知并会应用合适的设计模式。
首先,如今计算机系统的存储空间已经足够大了,达到了 TB 级别,因此相比于空间复杂度,时间复杂度是程序员首要考虑的因素。为了追求高性能,在某些频繁操作执行时,甚至可以考虑用空间换取时间。其次,由于受到处理器制造工艺的物理限制、成本限制,CPU 主频的增长遇到了瓶颈,摩尔定律已渐渐失效,每隔 18 个月 CPU 主频即翻倍的时代已经过去了,程序员的编程方式发生了彻底的改变。在目前这个多核多处理器的时代,涌现了原生支持多线程的语言(如 Java)以及分布式并行计算框架(如 Hadoop)。为了使程序充分地利用多核 CPU,简单地实现一个单线程的程序是远远不够的,程序员需要能够编写出并发或者并行的多线程程序。最后,大型软件系统的代码行数达到了百万级,如果没有一个设计良好的软件架构,想在已有代码的基础上进行开发,开发代价和维护成本是无法想象的。一个设计良好的软件应该具有可读性和可扩展性,遵循“开闭原则”、“依赖倒置原则”、“面向接口编程”等。
本文将介绍笔者经历的一个项目中的一部分,通过这个实例剖析代码优化的过程。下面简要地介绍该系统的相关部分。
该系统的开发语言为 Java,部署在共拥有 4 核 CPU 的 Linux 服务器上,相关部分主要有以下操作:通过某外部系统 D 提供的 REST API 获取信息,从中提取出有效的信息,并通过 JDBC 存储到某数据库系统 S 中,供系统其他部分使用,上述操作的执行频率为每天一次,一般在午夜当系统空闲时定时执行。为了实现高可用性(High Availability),外部系统 D 部署在两台服务器上,因此需要分别从这两台服务器上获取信息并将信息插入数据库中,有效信息的条数达到了上千条,数据库插入操作次数则为有效信息条数的两倍。
为了快速地实现预期效果,在最初的实现中优先考虑了功能的实现,而未考虑系统性能和代码可读性等。系统大致有以下的实现:(1)REST API 获取信息、数据库操作可能抛出的异常信息都被记录到日志文件中,作为调试用;(2)共有 5 次数据库连接操作,包括第一次清空数据库表,针对两个外部系统 D 各有两次数据库插入操作,这 5 个连接都是独立的,用完之后即释放;(3)所有的数据库插入语句都是使用 java.sql.Statement 类生成的;(4)所有的数据库插入语句,都是单条执行的,即生成一条执行一条;(5)整个过程都是在单个线程中执行的,包括数据库表清空操作,数据库插入操作,释放数据库连接;(6)数据库插入操作的 JDBC 代码散布在代码中。虽然这个版本的系统可以正常运行,达到了预期的效果,但是效率很低,从通过 REST API 获取信息,到解析并提取有效信息,再到数据库插入操作,总共耗时 100 秒左右。而预期的时间应该在一分钟以内,这显然是不符合要求的。
笔者开始分析整个过程有哪些耗时操作,以及如何提升效率,缩短程序执行的时间。通过 REST API 获取信息,因为是使用外部系统提供的 API,所以无法在此处提升效率;取得信息之后解析出有效部分,因为是对特定格式的信息进行解析,所以也无效率提升的空间。所以,效率可以大幅度提升的空间在数据库操作部分以及程序控制部分。下面,分条叙述对耗时操作的改进方法。
关闭日志记录,或者更改日志输出级别。因为从两台服务器的外部系统 D 上获取到的信息是相同的,所以数据库插入操作会抛出异常,异常信息类似于“Attempt to insert duplicate record”,这样的异常信息跟有效信息的条数相等,有上千条。这种情况是能预料到的,所以可以考虑关闭日志记录,或者不关闭日志记录而是更改日志输出级别,只记录严重级别(severe level)的错误信息,并将此类操作的日志级别调整为警告级别(warning level),这样就不会记录以上异常信息了。本项目使用的是 Java 自带的日志记录类,以下配置文件将日志输出级别设置为严重级别。
清单 1. log.properties 设置日志输出级别的片段
# default file output is in user ’ s home directory. # levels can be: SEVERE, WARNING, INFO, FINE, FINER, FINEST java.util.logging.ConsoleHandler.level=SEVERE java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter java.util.logging.FileHandler.append=true |
通过上述的优化之后,性能有了大幅度的提升,从原来的 100 秒左右降到了 50 秒左右。为什么仅仅不记录日志就能有如此大幅度的性能提升呢?查阅资料,发现已经有人做了相关的研究与实验。经常听到 Java 程序比 C/C++ 程序慢的言论,但是运行速度慢的真正原因是什么,估计很多人并不清楚。对于 CPU 密集型的程序(即程序中包含大量计算),Java 程序可以达到 C/C++ 程序同等级别的速度,但是对于 I/O 密集型的程序(即程序中包含大量 I/O 操作),Java 程序的速度就远远慢于 C/C++ 程序了,很大程度上是因为 C/C++ 程序能直接访问底层的存储设备。因此,不记录日志而得到大幅度性能提升的原因是,Java 程序的 I/O 操作较慢,是一个很耗时的操作。
共享数据库连接。共有 5 次数据库连接操作,每次都需重新建立数据库连接,数据库插入操作完成之后又立即释放了,数据库连接没有被复用。为了做到共享数据库连接,可以通过单例模式(Singleton Pattern)获得一个相同的数据库连接,每次数据库连接操作都共享这个数据库连接。这里没有使用数据库连接池(Database Connection Pool)是因为在程序只有少量的数据库连接操作,只有在大量并发数据库连接的时候才需要连接池。
public class JdbcUtil { private static Connection con; // 从配置文件读取连接数据库的信息 private static String driverClassName; private static String url; private static String username; private static String password; private static String currentSchema; private static Properties properties = new Properties(); static { // driverClassName, url, username, password, currentSchema 等从配置文件读取,代码略去 try { Class.forName(driverClassName); } catch (ClassNotFoundException e) { e.printStackTrace(); } properties.setProperty("user", username); properties.setProperty("password", password); properties.setProperty("currentSchema", currentSchema); try { con = DriverManager.getConnection(url, properties); } catch (SQLException e) { e.printStackTrace(); } } private JdbcUtil() {} // 获得一个单例的、共享的数据库连接 public static Connection getConnection() { return con; } public static void close() throws SQLException { if (con != null) con.close(); } } |
通过上述的优化之后,性能有了小幅度的提升,从 50 秒左右降到了 40 秒左右。共享数据库连接而得到的性能提升的原因是,数据库连接是一个耗时耗资源的操作,需要同远程计算机进行网络通信,建立 TCP 连接,还需要维护连接状态表,建立数据缓冲区。如果共享数据库连接,则只需要进行一次数据库连接操作,省去了多次重新建立数据库连接的时间。
使用预编译 SQL。具体做法是使用 java.sql.PreparedStatement 代替 java.sql.Statement 生成 SQL 语句。PreparedStatement 使得数据库预先编译好 SQL 语句,可以传入参数。而 Statement 生成的 SQL 语句在每次提交时,数据库都需进行编译。在执行大量类似的 SQL 语句时,可以使用 PreparedStatement 提高执行效率。使用 PreparedStatement 的另一个好处是不需要拼接 SQL 语句,代码的可读性更强。通过上述的优化之后,性能有了小幅度的提升,从 40 秒左右降到了 30~35 秒左右。
// 需要拼接 SQL 语句,执行效率不高,代码可读性不强 StringBuilder sql = new StringBuilder(); sql.append("insert into table1(column1,column2) values('"); sql.append(column1Value); sql.append("','"); sql.append(column2Value); sql.append("');"); Statement st; try { st = con.createStatement(); st.executeUpdate(sql.toString()); } catch (SQLException e) { e.printStackTrace(); } |
清单 4. 使用 PreparedStatement 的代码片段
// 预编译 SQL 语句,执行效率高,可读性强 String sql = “insert into table1(column1,column2) values(?,?)”; PreparedStatement pst = con.prepareStatement(sql); pst.setString(1,column1Value); pst.setString(2,column2Value); pst.execute(); |
使用 SQL 批处理。通过 java.sql.PreparedStatement 的 addBatch 方法将 SQL 语句加入到批处理,这样在调用 execute 方法时,就会一次性地执行 SQL 批处理,而不是逐条执行。通过上述的优化之后,性能有了小幅度的提升,从 30~35 秒左右降到了 30 秒左右。
使用多线程实现并发 / 并行。清空数据库表的操作、把从 2 个外部系统 D 取得的数据插入数据库记录的操作,是相互独立的任务,可以给每个任务分配一个线程执行。清空数据库表的操作应该先于数据库插入操作完成,可以通过 java.lang.Thread 类的 join 方法控制线程执行的先后次序。在单核 CPU 时代,操作系统中某一时刻只有一个线程在运行,通过进程 / 线程调度,给每个线程分配一小段执行的时间片,可以实现多个进程 / 线程的并发(concurrent)执行。而在目前的多核多处理器背景下,操作系统中同一时刻可以有多个线程并行(parallel)执行,大大地提高了计算速度。
Thread t0 = new Thread(new ClearTableTask()); Thread t1 = new Thread(new StoreServersTask(ADDRESS1)); Thread t2 = new Thread(new StoreServersTask(ADDRESS2)); try { t0.start(); // 执行完清空操作后,再进行后续操作 t0.join(); t1.start(); t2.start(); t1.join(); t2.join(); } catch (InterruptedException e) { e.printStackTrace(); } // 断开数据库连接 try { JdbcUtil.close(); } catch (SQLException e) { e.printStackTrace(); } |
通过上述的优化之后,性能有了大幅度的提升,从 30 秒左右降到了 15 秒以下,10~15 秒之间。使用多线程而得到的性能提升的原因是,系统部署所在的服务器是多核多处理器的,使用多线程,给每个任务分配一个线程执行,可以充分地利用 CPU 计算资源。
笔者试着给每个任务分配两个线程执行,希望能使程序运行得更快,但是事与愿违,此时程序运行的时间反而比每个任务分配一个线程执行的慢,大约 20 秒。笔者推测,这是因为线程较多(相对于 CPU 的内核数),使得 CPU 忙于线程的上下文切换,过多的线程上下文切换使得程序的性能反而不如之前。因此,要根据实际的硬件环境,给任务分配适量的线程执行。
使用 DAO 模式抽象出数据访问层。原来的代码中混杂着 JDBC 操作数据库的代码,代码结构显得十分凌乱。使用 DAO 模式(Data Access Object Pattern)可以抽象出数据访问层,这样使得程序可以独立于不同的数据库,即便访问数据库的代码发生了改变,上层调用数据访问的代码无需改变。并且程序员可以摆脱单调繁琐的数据库代码的编写,专注于业务逻辑层面的代码的开发。通过上述的优化之后,性能并未有提升,但是代码的可读性、可扩展性大大地提高了。
图 2. DAO 模式的层次结构
清单 6. 使用 DAO 模式的代码片段
// DeviceDAO.java,定义了 DAO 抽象,上层的业务逻辑代码引用该接口,面向接口编程 public interface DeviceDAO { public void add(Device device); } // DeviceDAOImpl.java,DAO 实现,具体的 SQL 语句和数据库操作由该类实现 public class DeviceDAOImpl implements DeviceDAO { private Connection con; public DeviceDAOImpl() { // 获得数据库连接,代码略去 } @Override public void add(Device device) { // 使用 PreparedStatement 进行数据库插入记录操作,代码略去 } } |
回顾以上代码优化过程:关闭日志记录、共享数据库连接、使用预编译 SQL、使用 SQL 批处理、使用多线程实现并发 / 并行、使用 DAO 模式抽象出数据访问层,程序运行时间从最初的 100 秒左右降低到 15 秒以下,在性能上得到了很大的提升,同时也具有了更好的可读性和可扩展性。
相关推荐
Java程序优化的最佳实践涉及到多个方面,包括性能提升、代码可读性和可扩展性的增强。优化过程中,首先要明确衡量程序质量的标准,例如时间复杂度、空间复杂度、可读性和可扩展性。对于现代计算机系统,时间复杂度...
发布于2013-5-16:本文介绍了Java代码优化的过程,总结了优化Java程序的一些最佳实践,分析了进行优化的方法并解释了性能提升的原因。多角度分析导致性能低的原因并逐个进行优化使得程序性能得到极大提升,代码...
《Java Enterprise 最佳实践》是Java开发者们深入理解企业级应用开发的重要参考资料,尤其是其中的JDBC最佳实践部分,对于数据库交互的优化和性能提升有着关键性的影响。JDBC(Java Database Connectivity)是Java...
Java编码最佳实践是提高代码质量、可读性、性能和可维护性的关键。这份指南涵盖了多个方面的编程建议,旨在帮助开发者遵循良好的编程习惯,确保代码的高效运行。 1. **资源管理**:在处理文件、流或其他资源时,...
编写高性能 Java 代码的最佳实践:本文首先介绍了负载测试、基于APM工具的应用程序和服务器监控,随后介绍了编写高性能Java代码的一些最佳实践。最后研究了JVM特定的调优技巧、数据库端的优化和架构方面的调整。
这份"Java程序性能优化"的资源将帮助开发者深入理解上述各个方面的细节,并提供实践案例和源码,为优化Java应用程序提供宝贵的指导。通过学习和应用这些知识,可以显著提升Java应用程序的性能,使之更加健壮和高效。
《Java程序性能优化》是葛一鸣在2012年10月出版的第一版专著,这本书深入探讨了如何提升Java应用程序的运行效率和性能。在Java开发中,性能优化是一个关键领域,它涉及到代码的高效编写、内存管理、线程调度、数据库...
《Java程序性能优化》这本书是Java开发者不可或缺的参考资料,它深入浅出地讲解了如何提升Java应用程序的效率和稳定性。本书结合理论与实践,既包含了基础的性能优化原则,也探讨了高级的优化技巧,适合从初级到中级...
13. **JVM(Java Virtual Machine)**:了解JVM的工作原理,包括类加载、字节码执行、内存模型等,对优化Java程序性能有很大帮助。 14. **单元测试(Unit Testing)**:学习使用JUnit等工具进行单元测试,确保代码...
《深入理解Java虚拟机JVM高级特性与最佳实践》是一本专注于Java开发人员提升技术水平的著作,由周志明撰写。这本书旨在填补Java技术体系中关于Java虚拟机(JVM)知识的空白,帮助读者深入理解JVM的工作原理及其对...
这包括避免冗余计算,减少不必要的对象创建,使用适当的数据结构和算法,以及遵循Java编程的最佳实践,如有效使用StringBuilder而非String进行字符串拼接,避免使用null检查可能导致NPE的代码。 2. **内存管理**:...
在本压缩包"多目标优化算法java.zip_affect4gx_java多目标优化_优化_多目标优化java_多目标优化算法"中,我们关注的是Java实现的多目标优化算法。 多目标优化与传统的单目标优化不同,后者只关注一个目标函数的最优...
总而言之,《深入理解Java7核心技术与最佳实践》这本书全面覆盖了Java 7的关键技术,包括语言特性、并发编程、虚拟机优化、I/O改进等多个方面,对于开发者来说是一本不可或缺的参考书籍。通过阅读和实践,开发者可以...
《Java虚拟机高级特性与最佳实践》是一本深入解析Java虚拟机(JVM)的权威著作,尤其在第二版中,作者对JVM的高级特性进行了详尽的阐述,并提供了丰富的最佳实践指导。这本书对于想要深入理解Java平台的开发者来说,...
对于Java工程师来说,掌握J2EE的最佳实践至关重要,这不仅可以提高代码质量,还能优化性能,确保系统的可维护性和可扩展性。以下是对"Java高级-12个最重要的J2EE最佳实践"的详细解释: 1. **模块化设计**:将应用...
11. **Java虚拟机(JVM)**:理解JVM的工作原理,如内存模型、垃圾回收机制,对优化Java程序性能至关重要。 12. **设计模式**:作为软件工程的最佳实践,设计模式是解决常见问题的模板,如单例、工厂、观察者等。...
总的来说,优化Java程序性能涉及多个方面:理解并利用好JVM,遵循最佳编码实践,运用性能分析工具,以及关注用户体验。通过不断学习和实践,我们可以使Java应用程序运行得更加高效、稳定,同时提供优秀的用户体验。...
"Android应用性能优化最佳实践"这本书深入探讨了如何提升Android应用的性能,以下是一些核心知识点的总结: 1. **内存管理**:内存泄漏是Android应用性能问题的常见来源。开发者需要学会使用内存分析工具,如MAT ...
在Java编程世界中,开发第一个Java程序是每个初学者必经的步骤,它标志着你正式踏...记住,实践是掌握任何编程语言的关键,所以不断编写代码、调试和优化将是提升技能的最佳途径。祝你在Java编程的学习道路上一切顺利!