`
guoqingcun
  • 浏览: 54948 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hibernate进行大数据量处理时的优化操作

阅读更多

近日为是否在项目中使用Hibernate进行大数据量的性能测试,有一些总结,
1) 在处理大数据量时,会有大量的数据缓冲保存在Session的一级缓存中,这缓存大太时会严重显示性能,所以在使用Hibernate处理大数据量的,可以使用session.clear()或者session. Evict(Object) 在处理过程中,清除全部的缓存或者清除某个对象。
2) 对大数据量查询时,慎用list()或者iterator()返回查询结果,
1. 使用List()返回结果时,Hibernate会所有查询结果初始化为持久化对象,结果集较大时,会占用很多的处理时间。
2. 而使用iterator()返回结果时,在每次调用iterator.next()返回对象并使用对象时,Hibernate才调用查询将对应的对象初始化,对于大数据量时,每调用一次查询都会花费较多的时间。当结果集较大,但是含有较大量相同的数据,或者结果集不是全部都会使用时,使用iterator()才有优势。
3. 对于大数据量,使用qry.scroll()可以得到较好的处理速度以及性能。而且直接对结果集向前向后滚动。
3) 对于关联操作,Hibernate虽然可以表达复杂的数据关系,但请慎用,使数据关系较为简单时会得到较好的效率,特别是较深层次的关联时,性能会很差。
4) 对含有关联的PO(持久化对象)时,若default-cascade="all"或者 “save-update”,新增PO时,请注意对PO中的集合的赋值操作,因为有可能使得多执行一次update操作。
5) 在一对多、多对一的关系中,使用延迟加载机制,会使不少的对象在使用时方会初始化,这样可使得节省内存空间以及减少数据库的负荷,而且若PO中的集合没有被使用时,就可减少互数据库的交互从而减少处理时间。
6) 对于大数据量新增、修改、删除操作或者是对大数据量的查询,与数据库的交互次数是决定处理时间的最重要因素,减少交互的次数是提升效率的最好途径,所以在开发过程中,请将show_sql设置为true,深入了解Hibernate的处理过程,尝试不同的方式,可以使得效率提升。
7) Hibernate是以JDBC为基础,但是Hibernate是对JDBC的优化,其中使用Hibernate的缓冲机制会使性能提升,如使用二级缓存以及查询缓存,若命中率较高明,性能会是到大幅提升。

8) Hibernate可以通过设置hibernate.jdbc.fetch_size,hibernate.jdbc.batch_size等属性,对Hibernate进行优化。


下面这条是为资深会员(robbin)做的评论

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

 

引用
3. 对于大数据量,使用qry.scroll()可以得到较好的处理速度以及性能。而且直接对结果集向前向后滚动。



这条结论是不准确的,实际上和具体的JDBC Driver有关,目前我看到的Driver中,jtds会表现的很好,其他的例如Oracle会性能更差,MySQL则对性能无影响,具体请看我前面分析JDBC Driver源代码的一贴。

http://forum.iteye.com/viewtopic.php?t=9881

 

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------

本文是从iteye.com转载。留下做为参考。原址:http://www.iteye.com/topic/1114392

分享到:
评论

相关推荐

    Hibernate下数据批量处理解决方案

    在Java开发中,尤其是涉及到大数据量的处理时,人们往往会质疑ORM框架,如Hibernate,是否适合进行批量数据操作。然而,实际上,通过适当的技术手段,我们可以有效地解决Hibernate在批量处理时可能出现的性能问题。...

    Hibernate性能优化研究.pdf

    然而,在实际应用过程中,如何有效地利用Hibernate来优化数据持久层的性能仍然是一大挑战。本文旨在通过对Hibernate的深入研究,探讨影响其性能的各种因素,并提出相应的优化策略。 #### 二、O/R Mapping及...

    使用 Hibernate Shards 对数据进行切分

    《使用Hibernate Shards对数据...总结,Hibernate Shards是应对大数据量和高并发场景的有效工具,通过数据分片提高数据库的处理能力。理解和熟练运用Hibernate Shards,能帮助开发者构建更加健壮、可扩展的分布式系统。

    Hibernate批量处理数据

    当对象数量过大时,会导致内存不足。为了解决这一问题,可以通过以下方式: 1. **定时刷新缓存**:在循环过程中,设定一定的阈值(如每20条记录),当达到该阈值时,使用`session.flush()`将缓存中的数据写入数据库...

    Hibernate进行数据查询

    在Java开发中,Hibernate是一个流行的持久化框架,它简化了数据库操作,使得开发者可以使用面向对象的方式来处理数据。本篇将详细阐述如何使用Hibernate进行数据查询,包括基本数据查询、HQL(Hibernate Query ...

    hibernate中处理大字段 网上收集的文档

    处理大字段时,由于数据量较大,可能会导致事务持续时间较长,增加死锁的风险。因此,合理设计事务边界,避免长时间持有事务,有助于提高系统并发性能。 总结来说,Hibernate处理大字段涉及到数据类型的选用、映射...

    浅析Hibernate下数据批量处理方法.doc

    然而,对于大数据量的批量处理,Hibernate的性能可能不如直接使用JDBC或其他低级数据库操作高效。这是因为Hibernate在默认情况下会缓存对象,以便在事务提交时进行一次性持久化,这可能导致内存消耗过大,尤其是在...

    优化Hibernate性能的几点建议

    这种方式特别适用于需要分批处理大数据量的情况。 #### 五、合理管理实体之间的关联关系 在设计模型时,需要注意实体之间的关联关系。过度使用多对多或多对一的关系可能会导致大量的N+1查询问题。为了避免这种情况...

    hibernate对Blob类型字段进行数据添加.txt

    在处理数据库操作时,经常需要存储二进制大对象(Binary Large Object,简称 BLOB),例如图像、视频等非文本数据。BLOB 类型是数据库系统中用于存储大量二进制数据的数据类型。在 Java 应用开发中,尤其是使用 ORM ...

    hibernate代码优化基于配置的多表查询

    在Java的Web开发中,Hibernate是一个非常流行的ORM(对象关系映射)框架,它使得开发者可以使用面向对象的方式来操作数据库,极大地提高了开发效率。本文将深入探讨如何通过配置优化Hibernate的多表查询,以提高应用...

    Hibernate优化

    然而,随着项目规模的扩大,如果不进行适当的优化,Hibernate可能会成为性能瓶颈。本文将深入探讨Hibernate的优化策略,帮助开发者提升应用性能。 一、配置优化 1. **连接池配置**:选择合适的连接池如HikariCP或...

    Hibernate缓存,性能优化

    - **异步更新策略**:采用异步更新机制,将频繁更新的数据操作排队处理,避免实时更新对性能的影响,同时确保数据的最终一致性。 #### 监控和调优 - **性能监控工具**:利用JProfiler、VisualVM等工具,定期分析...

    struts2+hibernate实现登录及增删改操作

    比如,合理使用缓存,避免频繁打开和关闭Session,使用预编译的SQL语句(PreparedStatement),以及对大数据量操作进行分批处理等。 综上所述,"struts2+hibernate实现登录及增删改操作"涉及到的是如何利用这两个...

    配置hibernate数据源

    配置Hibernate数据源是一项基础而重要的任务,涉及在Java应用程序中集成和使用Hibernate框架以及MySQL数据库。以下内容旨在详细介绍如何在MyEclipse开发环境中配置Hibernate数据源,同时解释相关概念和步骤。 首先...

    hibernate的大部分的工具类

    总结来说,这个压缩包中的工具类覆盖了Hibernate的多个方面,包括初始化设置、数据验证、分页处理以及HQL查询的优化。它们是后端开发中的重要组成部分,特别是对于涉及持久层操作的项目,这些工具类将极大地增强代码...

    Hibernate批量处理

    - **二级缓存管理**:在进行批量操作时,建议关闭Hibernate的二级缓存,以避免缓存同步问题。这可以通过在配置文件中设置`hibernate.cache.use_second_level_cache=false`来实现。 示例代码展示了一个批量插入十万...

    hibernate性能优化方案

    2. **Fetch Size和Batch Size**:这两个参数分别控制了每次从数据库读取的数据量和批量处理的数据量,合理设置可以提高效率。 3. **关闭SQL语句打印**:在生产环境中,关闭Hibernate的日志输出可以减少不必要的I/O...

Global site tag (gtag.js) - Google Analytics