转载：hibernate与应用缓存方案总结

qingzhuang

浏览: 185666 次

最近访客更多访客>>

晗瓦苏

良家少女

2222012222

vagrantvv

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hibernate

Hibernate 网络应用 SQL 数据结构 JBoss

XXXX项目是目前在实际工作中正在做的事情，该项目是一个大型系统的内容管理内核，负责最核心的meta data的集中管理，性能有较高的要求，设计初期就要求能够支持cluster。项目使用hibernate 3.2，针对开发过程中对于各种缓存的不同看法，撰写了本文。重点在于澄清一些hibernate的缓存细节，纠正一些错误的缓存用法。

一、hibernate的二级缓存
如果开启了二级缓存，hibernate在执行任何一次查询的之后，都会把得到的结果集放到缓存中，缓存结构可以看作是一个hash table，key是数据库记录的id，value是id对应的pojo对象。当用户根据id查询对象的时候（load、iterator方法），会首先在缓存中查找，如果没有找到再发起数据库查询。但是如果使用hql发起查询（find, query方法）则不会利用二级缓存，而是直接从数据库获得数据，但是它会把得到的数据放到二级缓存备用。也就是说，基于hql的查询，对二级缓存是只写不读的。

针对二级缓存的工作原理，采用iterator取代 list来提高二级缓存命中率的想法是不可行的。Iterator的工作方式是根据检索条件从数据库中选取所有目标数据的id，然后用这些id一个一个的到二级缓存里面做检索，如果找到就直接加载，找不到就向数据库做查询。因此假如iterator检索100条数据的话，最好情况是100%全部命中，最坏情况是0%命中，执行101条sql把所有数据选出来。而list虽然不利用缓存，但是它只会发起1条sql取得所有数据。在合理利用分页查询的情况下， list整体效率高于iterator。

二级缓存的失效机制由hibernate控制，当某条数据被修改之后，hibernate会根据它的id去做缓存失效操作。基于此机制，如果数据表不是被hibernate独占（比如同时使用jdbc或者ado等），那么二级缓存无法得到有效控制。

由于hibernate的缓存接口很灵活，cache provider可以方便的切换，因此支持cluster环境不是大问题，通过使用swarmcache、jboss cache等支持分布式的缓存方案，可以实现。但是问题在于:
1、分布式缓存本身成本偏高（比如使用同步复制模式的jboss cache）
2、分布式环境通常对事务控制有较高要求，而目前的开源缓存方案对事务缓存（transaction cache）支持得不够好。当jta事务发生会滚，缓存的最后更新结果很难预料。这一点会带来很大的部署成本，甚至得不偿失。

结论：XXXX不应把hibernate二级缓存作为优化的主要手段，一般情况下建议不要使用。

原因如下：
1、 XXXX 的DAO类大部分是从1.0升级过来，由于1.0采用的是hibernate 2.1，所以在批量删除数据的时候采用了native sql的方式。虽然XXXX2.0已经完全升级到hibernate 3.2，支持hibernate原生的批量删改，但是由于hibernate批量操作的性能不如sql，而且为了兼容1.0的dao类，所以很多地方保留了sql操作。哪些数据表是单纯被hibernate独占无法统计，而且随着将来业务的发展可能会有很大变数。因此不宜采用二级缓存。
2、针对系统业务来说，基于id检索的二级缓存命中率极为有限，hql被大量采用，二级缓存对性能的提升很有限。
3、 hibernate 3.0在做批量修改、批量更新的时候，是不会同步更新二级缓存的，该问题在hibernate 3.2中是否仍然存在尚不确定。

二、hibernate的查询缓存

查询缓存的实现机制与二级缓存基本一致，最大的差异在于放入缓存中的key是查询的语句，value是查询之后得到的结果集的id列表。表面看来这样的方案似乎能解决hql利用缓存的问题，但是需要注意的是，构成key的是：hql生成的sql、sql的参数、排序、分页信息等。也就是说如果你的hql有小小的差异，比如第一条hql取1-50条数据，第二条hql取20-60条数据，那么hibernate会认为这是两个完全不同的key，无法重复利用缓存。因此利用率也不高。

另外一个需要注意的问题是，查询缓存和二级缓存是有关联关系的，他们不是完全独立的两套东西。假如一个查询条件hql_1，第一次被执行的时候，它会从数据库取得数据，然后把查询条件作为 key，把返回数据的所有id列表作为value（请注意仅仅是id）放到查询缓存中，同时整个结果集放到class缓存（也就是二级缓存），key是 id，value是pojo对象。当你再次执行hql_1，它会从缓存中得到id列表，然后根据这些列表一个一个的到class缓存里面去找pojo对象，如果找不到就向数据库发起查询。也就是说，如果二级缓存配置了超时时间（或者发呆时间），就有可能出现查询缓存命中了，获得了id列表，但是 class里面相应的pojo已经因为超时(或发呆)被失效，hibernate就会根据id清单，一个一个的去向数据库查询，有多少个id，就执行多少个sql。该情况将导致性能下降严重。

查询缓存的失效机制也由 hibernate控制，数据进入缓存时会有一个timestamp，它和数据表的timestamp对应。当hibernate环境内发生save、 update等操作时，会更新被操作数据表的timestamp。用户在获取缓存的时候，一旦命中就会检查它的timestamp是否和数据表的 timestamp匹配，如果不，缓存会被失效。因此查询缓存的失效控制是以数据表为粒度的，只要数据表中任何一条记录发生一点修改，整个表相关的所有查询缓存就都无效了。因此查询缓存的命中率可能会很低。

结论：XXXX不应把hibernate二级缓存作为优化的主要手段，一般情况下建议不要使用。

原因如下：
1、 XXXX的上层业务中检索条件都比较复杂，尤其是涉及多表操作的地方。很少出现重复执行一个排序、分页、参数一致的查询，因此命中率很难提高。
2、查询缓存必须配合二级缓存一起使用，否则极易出现1+N的情况，否则性能不升反降
3、使用查询缓存必须在执行查询之前显示调用Query.setCacheable(true)才能激活缓存，这势必会对已有的hibernate封装类带来问题。

总结
详细分析hibernate的二级缓存和查询缓存之后，针对XXXX项目的具体情况做出结论，在底层使用通用缓存方案的想法基本上是不可取的。比较好的做法是在高层次中（业务逻辑层面），针对具体的业务逻辑状况手动使用数据缓存，不仅可以完全控制缓存的生命周期，还可以针对业务具体调整缓存方案提交命中率。 Cluster中的缓存同步可以完全交给缓存本身的同步机制来完成。比如开源缓存swarmcache采用invalidate的机制，可以根据用户指定的策略，在需要的时候向网络中的其他swarmcache节点发送失效消息，这一机制和XXXX1.0中已经采用的MappingCache的同步方案基本一致。建议采用。

分享到：

(转)js自动添加一行或删除一行 | 面向对象数据库设计方法

2007-05-21 17:49
浏览 1412
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Java 最常见 200+ 面试题全解析：面试必备.pdf: 11. SpringBoot/SpringCloud：SpringBoot简化了Spring应用的配置和部署，而SpringCloud则是云环境下微服务架构的一整套解决方案。 12. Hibernate：作为Java对象关系映射工具，Hibernate简化了数据持久化的复杂性，...

22T挖掘机回转减速器设计说明书.doc.doc: 22T挖掘机回转减速器设计说明书.doc.doc

步进式推刚机设计说明书.doc: 步进式推刚机设计说明书.doc

《单片机技术》课程设计说明书 8x8x8的光立方设计.docx: 《单片机技术》课程设计说明书 8x8x8的光立方设计.docx

累加平均算法verilog: 累加平均算法verilog

时间序列预测中SVM、BP神经网络与LSTM的应用及MATLAB实现: 内容概要：本文详细介绍了支持向量机(SVM)、BP神经网络和LSTM网络在时间序列预测中的应用及其MATLAB实现。首先，针对SVM部分，文章讲解了如何将时间序列数据转化为特征矩阵并通过滑动窗口进行预测，强调了交叉验证的重要性。对于BP神经网络，则着重于数据归一化以及网络结构的选择，并指出BP网络容易陷入局部最优的问题。最后，在LSTM部分，文章展示了如何利用MATLAB的深度学习工具箱实现LSTM网络，解决了输入数据格式转换的问题，并实现了滚动预测。文中提供了具体的代码示例，确保读者能够轻松替换数据源并运行程序。适用人群：适用于有一定MATLAB基础的时间序列预测初学者和技术爱好者。使用场景及目标：帮助读者掌握三种不同类型的机器学习模型在时间序列预测任务中的具体应用，理解各自的特点和优缺点，从而选择合适的模型应用于实际项目中。其他说明：文章不仅提供了详细的理论解释，还给出了完整的代码实现，使得读者可以直接上手实践。同时，作者提醒了一些常见的错误和注意事项，如数据格式、归一化等问题，有助于提高预测准确性。

基于S7-200 PLC与组态王的花式喷泉控制系统设计及其实现: 内容概要：本文详细介绍了利用S7-200 PLC和组态王构建智能花式喷泉控制系统的设计思路和技术细节。首先阐述了喷泉系统的基本构成，包括硬件部分如PLC、喷嘴及其连接方式，以及软件部分如喷嘴控制逻辑、喷泉变换逻辑和控制画面设计。接着展示了具体的梯形图接线图和代码实现，解释了关键变量的作用和程序流程。最后讨论了系统测试与调试的方法，强调了硬件配置、IO分配、通信配置等方面的注意事项，并分享了一些实用技巧。适合人群：对工业自动化感兴趣的工程技术人员，特别是从事PLC编程和组态软件应用的从业者。使用场景及目标：适用于需要设计和实施智能喷泉控制系统的项目，旨在提高喷泉展示的效果和管理效率。通过学习本文，读者可以掌握如何使用PLC和组态王创建复杂的喷泉控制系统，实现多样化的喷水模式。其他说明：文中提供了丰富的实践经验，包括常见问题的解决方案和优化建议，有助于读者更好地理解和应用相关技术。同时，附带的实际案例使理论更加生动具体，便于理解和模仿。

基于S7-200 PLC的饮料灌装机控制系统设计与实现: 内容概要：本文详细介绍了基于西门子S7-200 PLC的饮料灌装机控制系统的设计与实现。首先阐述了硬件设计，包括瓶体输送、定位检测、液体灌装、计数统计等环节的具体配置，如CPU224搭配EM221数字量扩展模块及其I/O分配。接着深入解析了梯形图程序的核心代码，涵盖系统启停控制、灌装流程控制以及产量统计等功能模块。此外，还展示了如何利用WinCC Flexible进行组态画面设计，实现了动态液位显示、实时计数器和电磁阀状态指示灯等功能。最后分享了一些调试过程中遇到的实际问题及解决方案，如接近开关接线错误、电磁阀动作引起的输出抖动等问题，并提出了效率优化技巧。适合人群：从事PLC编程、自动化控制系统的工程师和技术人员，尤其是对西门子S7-200系列PLC感兴趣的读者。使用场景及目标：适用于饮料行业或其他类似行业的灌装生产线控制系统开发项目。目标是帮助读者掌握S7-200 PLC在实际生产环境中的应用方法，提高系统的稳定性、可靠性和效率。其他说明：文中不仅提供了详细的理论讲解，还包括了许多实用的经验分享和注意事项，有助于读者更好地理解和应用于实际工作中。同时，对于初学者而言，可以作为学习PLC编程和控制系统设计的良好参考资料。

6156铝合金平板对接焊焊接工艺及夹具设计设计说明书.doc: 6156铝合金平板对接焊焊接工艺及夹具设计设计说明书.doc

中兴U30高级web后台app: 中兴U30高级web后台app

基于LABVIEW的西门子PLC数据采集处理程序设计与实现: 内容概要：本文详细介绍了一款基于LABVIEW开发的通用型PLC通讯与数据处理程序。该程序主要用于与西门子PLC进行通讯，完成数据采集、存储、回放、处理及报警显示等功能。文中具体介绍了各个功能模块的实现方法和技术要点，包括OPC协议通讯、内存和CSV文件存储、数据回放与处理、报警逻辑等。此外，作者还分享了一些开发过程中遇到的问题及其解决方案。适合人群：从事工业自动化领域的工程师、技术人员，尤其是熟悉LABVIEW和PLC编程的专业人士。使用场景及目标：适用于需要进行工业数据采集和处理的各种项目，旨在帮助开发者快速构建稳定可靠的数据采集系统，提高工作效率。其他说明：文中提供了详细的代码示例和注意事项，有助于读者更好地理解和应用相关技术。同时，该程序具有良好的扩展性和灵活性，可以根据具体需求进行定制化开发。

Realtek PCIe GBE Family Controller网卡驱动程序 v2.1 Win7 or above: 老网卡驱动程序，给老电脑老系统(XP,WIN7等)留存备用啦

新能源汽车领域的电动汽车方案详解：涵盖BMS、电机控制与PCB设计: 内容概要：本文详细介绍了最新的电动汽车设计方案，涉及电池管理系统(BMS)、电机控制以及PCB设计等方面。文中首先展示了高压平台的BMS控制板及其采用的Rust语言实现的主动均衡算法，该算法通过移动平均替代传统阈值判断，提高了均衡效率。接着讨论了电机控制部分，特别是FOC算法的实现细节，强调了硬件设计中的关键组件选择和布局技巧，如MOSFET驱动电路和DC-Link电容的放置。此外，文章还探讨了CAN总线通信协议的应用，确保各模块间稳定的数据传输。最后提到了一些实用的设计建议，如热管理和防呆设计等。适合人群：从事新能源汽车研究与开发的专业人士，尤其是对电动汽车硬件设计和软件实现感兴趣的工程师。使用场景及目标：帮助读者深入了解电动汽车的关键技术和设计理念，为实际项目提供理论支持和技术指导。同时，也为初学者提供了入门级别的理解和实践方法。其他说明：文章不仅包含了详细的代码示例和技术解析，还附带了一些实用的小贴士，如硬件防护措施和设计注意事项。

(整理)平压印刷机运动方案和主要机构设计课程设计说明书.doc: (整理)平压印刷机运动方案和主要机构设计课程设计说明书.doc

蛋壳清洁机设计说明书.pdf: 蛋壳清洁机设计说明书.pdf

二氧化硫填料吸收塔设计_毕业设计说明书.doc: 二氧化硫填料吸收塔设计_毕业设计说明书.doc

三相与单相整流仿真：基于双闭环PI控制、SVPWM及PLL的应用与优化: 内容概要：本文详细探讨了三相和单相整流仿真中的关键技术，重点介绍了双闭环PI控制、空间矢量脉宽调制(SVPWM)以及锁相环(PLL)的应用。文章首先解释了三相整流中的电压外环和电流内环的作用机制，强调了电流内环PI参数调节的重要性，并提供了具体的MATLAB代码示例。接着讨论了PLL在电网电压跌落情况下的表现及其改进方法，如采用二阶广义积分器(SOGI)结构提高稳定性。对于SVPWM部分，则讲解了扇区判断逻辑和波形生成的具体步骤，指出调制比过高会导致波形畸变的问题并提出解决方案。此外，还涉及了单相整流中SPWM的实现方式，包括虚拟正交生成和电流环设计，以及如何应对二次谐波干扰。最后，文章总结了一些实用的经验和技术要点，如参数整定、仿真步长选择等。适合人群：从事电力电子研究的技术人员、高校相关专业师生、对电力电子控制系统感兴趣的工程师。使用场景及目标：适用于希望深入了解三相和单相整流仿真原理的研究者，旨在帮助他们掌握双闭环控制、SVPWM和PLL的实际应用技巧，从而更好地进行系统设计和故障排除。其他说明：文中不仅包含了详细的理论分析，还附有大量的代码片段供读者参考实践，有助于加深理解和提高动手能力。同时提醒读者关注一些常见的陷阱和注意事项，确保仿真结果更加可靠。

joblib-0.12.2-py2.py3-none-any.whl: 该资源为joblib-0.12.2-py2.py3-none-any.whl，欢迎下载使用哦！

基于PLC的电阻炉温度控制系统设计与实现：从梯形图到组态画面的实战解析: 内容概要：本文详细介绍了基于PLC的电阻炉温度控制系统的完整设计方案，涵盖硬件配置、IO分配、梯形图编程以及组态画面设计。首先，文章展示了硬件架构的选择与配置，包括选用西门子S7-1200 CPU、热电偶、固态继电器等组件。接着，深入探讨了梯形图编程的关键部分，特别是PID控制算法的应用及其优化方法，如抗积分饱和设置、分段PID参数调整等。此外，文章还强调了组态画面设计的人机交互体验，确保操作简便且直观。最后，分享了一些调试经验和常见问题解决方案，如热电偶补偿导线的正确接线、环境温度补偿算法等。适合人群：从事工业自动化领域的工程师和技术人员，尤其是有志于深入了解PLC温度控制系统设计的专业人士。使用场景及目标：适用于冶金、化工等行业中涉及高温加热工艺的企业，旨在提高温度控制精度，降低能耗，保障生产安全。通过学习本文，读者能够掌握完整的PLC温度控制系统设计流程，应用于实际工程项目中。其他说明：文中提供的技术细节仅供参考，在具体应用时需根据实际情况进行适当调整。建议在实施前进行充分的仿真测试，确保系统的稳定性和可靠性。

LabVIEW调用VisionPro实现工业级机器视觉应用的关键技术和最佳实践: 内容概要：本文详细介绍了如何利用LabVIEW调用VisionPro框架进行工业级机器视觉应用开发。主要内容涵盖加载和运行VPP文件、相机采集与图像处理、图像保存、标定流程、实时图像采集显示以及内存管理和参数设置等方面。文中不仅提供了具体的代码示例，还分享了许多实用技巧和注意事项，如避免内存泄漏的方法、正确的标定步骤、图像格式转换等。适合人群：从事机器视觉开发的技术人员，尤其是那些需要将LabVIEW与VisionPro结合使用的开发者。使用场景及目标：适用于需要开发复杂机器视觉系统的场合，旨在提高图像处理效率、精度和稳定性。具体应用场景包括但不限于自动化生产线的质量检测、产品外观缺陷检测等。其他说明：文章强调了在开发过程中应注意的问题，如内存管理、图像格式转换、标定精度等，并提供了一些优化建议和技术细节，有助于开发者更好地理解和掌握这两款工具的联合使用方法。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论