原文作者: 贾小骏
原文地址: http://my.eoe.cn/morefree/archive/5999.html
许多应用程序在压力测试阶段或在生产环境中都会遇到性能问题。如果我们看一下性能问题背后的原因,会发现很多是由数据处理不当造成。数据处理在应用面对大数据量时是非常关键的。这里有一些实用的数据处理技巧可以帮助更好地提升Java应用程序性能。
减少数据传输
在任何Java应用程序中,方法调用要么是为调用方完成某项任务,要么是对输入数据进行处理。这两个目标都需要在调用者和处理方法之间进行数据交换。关于最小化函数传入和输出的数据量有一个经验之谈:数据越小好处越多。比如越小的数据处理就越少,需要清理的对象越少,内存的占用也更少等等。程序设计应当努力减少不同方法、层次和应用程序之间,甚至组织之间的数据传递。通过下面将要讨论的源端数据处理可以达成这个目标。
延迟加载
延迟数据加载是指直到实际需要最后一刻才从数据存储中获取数据。在面对重量级对象时这是非常有益的。例如有一个存储在数据库中的文件实体,文件包含blob以及与其他属性。blob大小可以从几KB到几十兆。中间层逻辑在显示文件内容之前都只依赖于其他属性。使用延迟加载可以用来处理这个blob属性。
不断重复数据调用
当进行远程调用时,从数据提供者反复调用取得数据会严重影响性能,比如数据库调用、Web服务调用或者其他编解码调用。这种情况下可以使用Facade模式一次获得所有所需的数据,尽可能减小连接成本和在网络上传输数据的成本。
高速缓冲
经常使用但不经常变化的数据可以进行缓存,通常需要缓存的是静态或者服务端数据。如今,对应用事务数据也有很高的要求,这些数据也需要加入缓存。作为一个简单的规则,在设计应用程序时经常需要识别这类实体并缓存到合适的位置,通常这些实体不会频繁改变甚至根本不会变化。刷新对象时也可以采用这个规则。
在源端处理数据
在数据源或存储位置本身进行处理是一个好习惯。将大量数据发送给客户端然后再进行处理需要传输成本,而且有时客户端的处理逻辑会改变数据格式。例如在oracle中过滤数据比较简单,只要为查询添加一个WHERE子句即可。而在Java程序中过滤这么数据需要先获取记录再逐行挨个属性进行比较。因此用Java可能不是最佳实现。
尽可能减少数据转换和避免不正确的数据类型
将数据从一种格式转换到其他格式需要转换成本。对单个值进行转换消耗的性能可能微不足道,但如果记录个数成千上万性能问题就十分明显。例如选择String数据类型的值,并把它转换为double或其他基本类型,反之亦然。
保持数据的正确采集
从性能的角度来看,这是一个非常重要的考虑因素。 Java已经提供了不同的集合以满足不同的需求,例如有几种原始的集合,比如ArrayList,你可以不断向ArrayList添加数据并且集合本身不会对数据进行任何操作。再比如Vector提供了同步的操作。我需要在插入数据时保持同步吗?这是一个很好的问题。如果不需要同步那么就不要使用Vector,使用ArrayList或根据要求选择他集合。
对数据处理算法进一步优化
有时候性能问题是数据处理算法或实现逻辑造成的。实现逻辑应该将性能作为要求达到的一个目标,像是内存占用等。通过以下几个方法可以使算法进一步优化:
- 优化开销很大的调用和数据库循环调用
- 优化循环里的对象声明
- 避免不必要的嵌套循环
- 将对象存储到多个集合
Finalize重型数据对象
我们不能保证会立即执行垃圾收集,但是为对象设置为final或置为null是一个很好的做法。
利用技术特点优化数据处理
许多技术都有助于数据处理,其中包含了上面提到的一些要点。下面是几个例子:
- Oracle的prepared statement
- 缓存框架,例如Hibernate的一级缓存和二级缓存
- Hibernate框架的延迟加载机制
- 数据序列化和反序列化
在设计时需要避免性能代价过高的操作。如果没有这样的操作,还可以把数据转换减到最小。例如在Web应用程序可以尽量减少会话的输出数据。
并行处理数据
如果需要处理的数据量很大,那么可以并行处理不相关的数据以减少总的处理时间。
对象重用
对于重量级对象不要从头创建,可以对现有对象进行克隆并且只修改必要的属性尽可能重用现有的信息。通过浅拷贝和深拷贝来控制重用的数量。
相关推荐
"提升你的Java应用性能改善数据处理Java开发Java经验技巧"这一主题涵盖了许多关键的知识点,下面将对其进行详细的阐述。 1. **JVM调优**:Java虚拟机(JVM)是Java程序运行的基础,理解和优化JVM参数对提升性能至关...
无论是通过优化编码习惯来提高客户端体验,还是通过调整服务器配置来提高数据处理效率,每一个小步骤都能带来显著的性能提升。最重要的是持续监控应用程序的表现,并根据实际需求调整优化策略。
本资源包含一个PDF文档和相关的视频教程,旨在帮助你提升Java程序的速度和稳定性。 首先,我们要理解性能优化的含义。在Java编程中,性能优化涉及减少程序的响应时间、降低系统资源消耗以及提高并发处理能力等方面...
Stream API则为数据处理提供了新途径,特别是大数据集的处理,能够利用多核处理器进行并行计算,显著提升性能。 2. **《Java技术手册:第6版.pdf》** 这本手册全面覆盖了Java语言的各个方面,包括内存管理、垃圾...
Java程序性能优化是Java开发中的重要环节,它旨在提高应用程序的运行效率,减少资源消耗,提升用户体验。在Java世界中,性能优化涵盖了多个层面,包括代码优化、内存管理、线程调度、数据库交互以及JVM参数调整等。...
数据局部性设计模式旨在通过安排数据在内存中的位置,利用空间局部性来最小化数据访问时间并提高缓存利用率。该模式在高性能计算、实时数据处理和游戏...这对于游戏引擎和实时数据处理系统等高性能应用程序至关重要。
"Java程序性能优化"这个主题涵盖了多种技术与策略,旨在提升Java应用程序的运行速度,减少内存占用,以及改善整体系统性能。这份资料"Java程序性能优化.rar"包含了高清文档和书籍源码,为我们提供了深入学习和实践...
《编写高质量代码:改善Java程序的151个建议》是一本专为Java开发者准备的实战指南,旨在提升代码质量并帮助程序员从初级迈向高级。这本书涵盖了从基础到高级的各种编程实践,通过151个具体的建议,为读者提供了一个...
Java应用程序在Linux平台上的性能优化是一个复杂而重要的主题,尤其是在高并发和大规模数据处理的场景下。Java线程堆分析是定位和解决性能问题的有效工具,它提供了关于应用程序线程状态和执行路径的详细信息。 ...
总的来说,这种基于Java的实时标记方法是针对大数据碎片化问题的一种有效应对策略,它结合了Java平台的高效性和线性函数转换的数学工具,旨在优化大数据处理流程,提升数据质量和分析效率,对于云时代下大数据应用的...
在Java编程领域,性能优化是不可或缺的一环,尤其是在构建大规模、高并发的系统时。"高性能java代码优化建议"这一主题涵盖了众多...通过深入学习和实践,开发者可以不断提升自己的Java编程技能,编写出更高性能的代码。
本文将关注基于Java EE的系统性能提升,探讨影响应用性能的各个方面,包括但不限于设计、开发、部署和运行阶段。首先,设计阶段应考虑系统架构的可扩展性和负载均衡策略,以适应高并发场景。其次,在开发阶段,选择...
微基准测试是评估性能改善的有效方法。 2. **展示代码**:优化应该基于代码本身,阅读并理解JDK源码是提高优化能力的重要步骤。通过查看源码,可以更深入地了解类和方法的工作原理,从而做出明智的优化决策。 **...
只有深入理解这些知识点,并在实践中不断探索和调整,才能有效地提升Java应用的性能,满足用户需求,增强业务竞争力。同时,性能优化也能降低运行成本,提高能源效率,对企业的可持续发展有着重要意义。
《JAVA性能优化权威指南》是一本深度探讨Java应用程序性能提升的专业书籍,对于任何希望优化Java应用性能的开发者来说,都是一份宝贵的参考资料。该书详细阐述了如何通过一系列技术和策略来提升Java应用的运行效率,...
### Weblogic Server应用性能考虑及调优 #### 摘要 本文主要针对Weblogic Server的应用性能考虑及其调优方法进行了详细的阐述。考虑到性能优化是一个系统性工程,它覆盖了项目开发周期的各个环节,文中从多个角度...
性能改善的目标不仅是提高单用户环境的响应速度,更是要提升在大量并发用户情况下的系统稳定性。10%-20%的性能提升在大规模用户中可能带来显著差异。 在进行性能测试时,可能会需要不断调整和优化模拟环境,以确保...
在当今互联网快速发展背景下,高性能的Java应用已经成为企业竞争力的重要标志。面对突发流量、大促活动等场景下的高并发需求,如何确保系统稳定高效地运行,是每个Java开发者都需要面对的问题。本文将围绕“Java性能...
- **模块系统**:Java 9引入了模块系统,改善了大型应用的组织和依赖管理。 - **垃圾收集(GC)**:自动内存管理,避免内存泄露,但开发者仍需理解内存分配和回收原理。 - **JNI(Java Native Interface)**:允许...