`
xiaoer_1982
  • 浏览: 1875259 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

数据缓存策略

阅读更多

数据缓存策略

(一)hibernate数据缓存策略

缓存是数据库数据在内存中的临时容器,它包含了库表数据在内存中的拷贝,位于数据库与数据访问层之间。对于查询操作相当频繁的系统(论坛,新闻发布等),良好的缓存机制显得尤为重要。

ORM在进行数据读取时,首先在缓存中查询,避免了数据库调用的性能开销。

ORM的数据缓存应包含下面几个层次:
1)事务级缓存 2)应用级缓存 3)分布式缓存

具体针对Hibernate而言,采用两级缓存策略,其过程描述:
(1)条件查询的时候,总是发出一条select * from table_name where …. 这样的SQL语句查询数据库,一次获得所有的数据对象。
(2) 把获得的所有数据对象根据ID放入到第二级缓存中。
(3) 当Hibernate根据ID访问数据对象的时候,首先从Session一级缓存中查;查不到,如果配置了二级缓存,那么从二级缓存中查;查不到,再查询数据库,把结果按照ID放入到缓存。
(4) 删除、更新、增加数据的时候,同时更新缓存。

1. 一级缓存(session level)-数据库事务级缓存

1)根据主键id加载数据时。 Session.load(), Session.iterate()方法

2)延迟加载时

Session内部维护一个数据对象集合,包括了本Session内选取的、操作的数据对象。这称为Session内部缓存,是Hibernate的第一级最快缓存,属于Hibernate的既定行为,不需要进行配置(也没有办法配置 :-)。

内部缓存正常情况下由hibernate自动维护,但也可人工干预:
1) Session.evict (): 将某个特定对象从内部缓存中清除
2)Session.clear(): 清空内部缓存

2.二级缓存(SessionFactory level)-应用级缓存

二级缓存由SessionFactory的所有session实例共享。

3. 第三方缓存实现

EHCache, OSCahe

hibernate批量查询引起的内存溢出问题

批量查询基本不适合使用现有的持久层技术来做,如CMP或hibernate,IBatis倒是可以.

因为每次调用Session.save()方法时,当前session都会将对象纳入到自身的内部缓存中。内部缓存不同于二级缓存,我们可以在二级缓存的配置中指定其最大容量。

解决方案:

1)在批处理情况下,关闭Hibernate缓存,如果关闭Hibernate缓存,那么和直接使用JDBC就没有区别。

2) 每隔一段时间清空Session内部缓存

Session实现了异步write-behind,它允许Hibernate显式地写操作的批处理。 这里,我给出Hibernate如何实现批量插入的方法:首先,我们设置一个合理的JDBC批处理大小,hibernate.jdbc.batch_size 20。 然后在一定间隔对Session进行flush()和clear()。

Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();
for ( int i=0; i<100000; i++ ) {
Customer customer = new Customer(.....);
session.save(customer);
if ( i % 20 == 0 ) {
//flush 插入数据和释放内存:
session.flush(); session.clear(); }
}
tx.commit();
session.close();

为了优化性能,可执行批量操作。在传统的JDBC编程中,批量操作方式如下,将数个SQL操作批量提交:

PrepareStatement ps=conn.prepareStatement("insert into users(name) values(?)");
for(int i=0;i<100000;i++){
ps.setString(1, "user"+i);
ps.addBatch();
}
int[] counts=ps.executeBatch

在Hibernate中,可以设置hibernate.jdbc.batch_size 参数来指定每次提交的sql数量。

hibernate2和hibernate3数据批量删除机制分析

1.hibernate2

Transaction tx=session.beginTransaction();
session.delete("from users");
tx.commit();

观察日志输出:

select ... from users
Hibernate:delete from users where id=?
Hibernate:delete from users where id=?
Hibernate:delete from users where id=?
...

hibernate2版本会首先从数据库中查询出所有符合条件的记录,再对此记录循环删除。如果记录量过大,势必引起内存溢出和删除效率问题。ORM为什么要这么做呢?因为ORM为了自动维护内存状态,必须知道用户到底对哪些数据进行了操作。问题的解决方法:

1)内存消耗

批量删除前首先从数据库中查询出所有符合条件的记录,如果数据量过大,就会导致 OutOfMemoryError.

可以采用Session .iterate或Query.iterate方法逐条获取记录,再执行delete操作。另外,hibernate2.16后的版本提供了基于游标的数据遍历操作:

Transaction tx=session.beginTransaction();

String hql="from users";
Query query=session.createQrery(hql);
ScrollableResults sr=query.scroll();
while(sr.next()){
TUser user=(TUser)sr.get(0);
session.delete();
}

tx.commit();

2)循环删除的效率问题

由于hibernate在批量删除操作过程中,需要反复调用delete SQL,存在性能问题。我们仍然可以通过调整hibernate.jdbc.batch_size参数来解决。

2.hibernate3

hibernate3 HQL中引入了 bulk delete/update操作, 即通过一条独立的sql语句来完成数据的批量操作。

Transaction tx=session.beginTransaction();

String hql="delete TUser";
Query query=session.createQrery(hql);
int count=query.executeUpdate();

tx.commit();

观察日志输出:

Hibernate:delete from TUser

(二)ibatis数据缓存

    相对Hibernate 等封装较为严密的ORM 实现而言(因为对数据对象的操作实现
了较为严密的封装,可以保证其作用范围内的缓存同步,而ibatis 提供的是半封闭
的封装实现,因此对缓存的操作难以做到完全的自动化同步)。
ibatis 的缓存机制使用必须特别谨慎。特别是flushOnExecute 的设定(见
“ibatis配置”一节中的相关内容),需要考虑到所有可能引起实际数据与缓存数据
不符的操作。如本模块中其他Statement对数据的更新,其他模块对数据的更新,甚
至第三方系统对数据的更新。否则,脏数据的出现将为系统的正常运行造成极大隐患。
如果不能完全确定数据更新操作的波及范围,建议避免Cache的盲目使用。
1.iBatis cache设置
sqlmap-config.xml在<sqlMapConfig>里面加入

<settings

cacheModelsEnabled="true"

enhancementEnabled="true"

lazyLoadingEnabled="true" />

maps.xml在<sqlMap>里面加入

<cacheModel id="userCache" type="LRU" readonly="true" serialize="false">

<flushInterval hours="24"/>

<flushOnExecute statement="insertTest"/>

<property name="size" value="1000" />

</cacheModel>

可以看到,Cache有如下几个比较重要的属性:readOnly,serialize,type


readOnly
readOnly值的是缓存中的数据对象是否只读。这里的只读并不是意味着数据对象一
旦放入缓存中就无法再对数据进行修改。而是当数据对象发生变化的时候,如数据对
象的某个属性发生了变化,则此数据对象就将被从缓存中废除,下次需要重新从数据
库读取数据,构造新的数据对象。

serialize
如果需要全局的数据缓存,CacheModel的serialize属性必须被设为true。否则数据缓存只对当前Session(可简单理解为当前线程)有效,局部缓存对系统的整体性能提升有限。

Cache Type:
与hibernate类似,ibatis通过缓冲接口的插件式实现,提供了多种Cache的实现机制可供选择:
1. MEMORY
2. LRU
3. FIFO
4. OSCACHE

MEMORY类型Cache与WeakReference
MEMORY 类型的Cache 实现,实际上是通过Java 对象引用进行。ibatis 中,其实现类
为com.ibatis.db.sqlmap.cache.memory.MemoryCacheController,MemoryCacheController 内部,
使用一个HashMap来保存当前需要缓存的数据对象的引用。

LRU型Cache
当Cache达到预先设定的最大容量时,ibatis会按照“最少使用”原则将使用频率最少
的对象从缓冲中清除。可配置的参数有:
flushInterval:指定了多长时间清除缓存,上例中指定每24小时强行清空缓存区的所有内容。
size

FIFO型Cache
先进先出型缓存,最先放入Cache中的数据将被最先废除。

OSCache

三)开源数据缓存策略OSCache

可以解决的问题:

1)信息系统中需要处理的基础数据的内容短时间内是不会发生变化的,但是在一个相对长一些的时间里,它却可能是动态增加或者减少的。

2)统计报表是一个周期性的工作,可能是半个月、一个月或者更长的时间才会需要更新一次,然而统计报表通常是图形显示或者是生成pdf、word、excel等格式的文件,这些图形内容、文件的生成通常需要消耗很多的系统资源,给系统运行造成很大的负担。

OSCache是OpenSymphony组织提供的一个J2EE架构中Web应用层的缓存技术实现组件。OSCache支持对部分页面内容或者对页面级的响应内容进行缓存,编程者可以根据不同的需求、不同的环境选择不同的缓存级别。可以使用内存、硬盘空间、同时使用内存和硬盘或者提供自己的其他资源(需要自己提供适配器)作为缓存区。

使用步骤:

1. 下载、解压缩OSCache

请到OSCache的主页http://www.opensymphony.com/oscache/download.html下载Oscache的最新版本,作者下载的是OSCache的最新稳定版本2.0。

将下载后的。Zip文件解压缩到c:\oscache(后面的章节中将使用%OSCache_Home%来表示这个目录)目录下

2. 新建立一个web应用

3. 将主要组件%OSCache_Home%\oscache.jar放入WEB-INF\lib目录

4. commons-logging.jar、commons-collections.jar的处理

  • OSCache组件用Jakarta Commons Logging来处理日志信息,所以需要commons-logging.jar的支持,请将%OSCache_Home%\lib\core\commons-logging.jar放入classpath(通常意味着将这个文件放入WEB-INF\lib目录)
  • 如果使用JDK1.3,请将%OSCache_Home%\lib\core\commons-collections.jar放入classpath,如果使用JDK1.4或者以上版本,则不需要了

5. 将oscache.properties、oscache.tld放入WEB-INF\class目录

  • %OSCache_Home%\oscache.properties包含了对OSCache运行特征值的设置信息
  • %OSCache_Home%\oscache.tld包含了OSCache提供的标签库的定义内容

6. 修改web.xml文件

在web.xml文件中增加下面的内容,增加对OSCache提供的taglib的支持:

<taglib>
<taglib-uri>oscache</taglib-uri>
<taglib-location>/WEB-INF/classes/oscache.tld</taglib-location>
</taglib> 

7.最简单的cache标签用法

使用默认的关键字来标识cache内容,超时时间是默认的3600秒

<cache:cache>
<%
//自己的JSP代码内容
%>
</cache:cache> 

8. 缓存单个文件

在OSCache组件中提供了一个CacheFilter用于实现页面级的缓存,主要用于对web应用中的某些动态页面进行缓存,尤其是那些需要生成pdf格式文件/报表、图片文件等的页面,不仅减少了数据库的交互、减少数据库服务器的压力,而且对于减少web服务器的性能消耗有很显著的效果。

修改web.xml,增加如下内容,确定对/testContent.jsp页面进行缓存。

<filter>
      <filter-name>CacheFilter</filter-name>
<filter-class>com.opensymphony.oscache.web.filter.CacheFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>CacheFilter</filter-name>
<!-对/testContent.jsp页面内容进行缓存-->
      <url-pattern>/testContent.jsp</url-pattern>
</filter-mapping>
分享到:
评论

相关推荐

    数据库数据缓存策略:实现方法与代码实践

    通过实施有效的数据缓存策略,我们可以显著降低数据访问的延迟,提高系统的响应速度。本文介绍的多种数据缓存方法和最佳实践,可以帮助开发者和数据库管理员优化数据库性能,提高数据管理的效率。

    论文研究-一种基于四叉树的空间数据缓存策略.pdf

    提出了以四叉树作为缓存数据结构,结合广泛应用的LRU和LFU算法,给出了一种高效的缓存策略—基于四叉树的空间数据缓存策略,并详细描述了缓存框架和缓存策略。提出的缓存策略充分考虑了空间数据访问所具有的时间局部...

    数据缓存和图片缓存

    数据缓存策略包括: 1. LRU(Least Recently Used):最近最少使用的替换策略,当缓存满时,优先淘汰最近最久未使用的数据。 2. LFU(Least Frequently Used):使用频率最低的替换策略,淘汰使用频率最低的数据。 ...

    缓存应用程序页面和数据

    通过理解和熟练运用C#中的缓存机制,结合适当的数据缓存策略,可以显著提高应用程序的响应速度,为用户提供更流畅的体验。在实际开发中,根据项目需求选择合适的缓存技术和策略,同时注意缓存的维护和优化,是每个...

    电信设备-传输信道数据缓存方法.zip

    在电信设备领域,数据传输和缓存管理是关键的技术环节,尤其在高容量、低延迟的需求下,优化传输信道的数据缓存策略显得尤为重要。"电信设备-传输信道数据缓存方法.zip"这个压缩包文件,包含了对这一主题的深入探讨...

    Hibernate缓存策略(一级缓存、二级缓存).docx

    Hibernate 缓存策略是优化应用程序性能的关键组成部分,尤其是在频繁访问数据库的情况下。...在实际开发中,开发者应根据具体业务场景,选择合适的数据缓存策略,确保性能优化的同时,兼顾数据的准确性和安全性。

    基于FPGA的DDR3高速图像缓存策略.pdf

    综上所述,本文提出的基于FPGA的DDR3高速图像缓存策略,不仅可以实现图像处理领域对于高速数据缓存的需求,而且通过高效利用DDR3内存的高带宽特性,显著提高了图像数据处理的速度和效率。这项技术的发展与应用,为...

    类库数据上传缓存的使用批处理

    中钢马鞍山研究院的研究成果很可能就是针对这种批处理技术的优化和应用,可能包括了如何更有效地组织和执行批处理任务,以及如何在批处理中集成数据缓存策略。 在倒数据这个文件名中,我们可以推测这是一个数据迁移...

    Hibernate的缓存策略

    通常情况下,可以通过配置缓存策略(如读写策略、刷新策略等)来保证数据的一致性和有效性。 - **性能优化**:合理利用二级缓存可以显著提升系统的性能。例如,在多用户共享数据的应用场景中,使用二级缓存可以大幅...

    行业分类-设备装置-一种大规模网络流式数据缓存写入的方法.zip

    本文将深入探讨标题为“行业分类-设备装置-一种大规模网络流式数据缓存写入的方法”的主题,基于提供的描述和标签,我们可以推测这是一个关于如何在大规模网络环境中优化数据缓存策略的技术方案。 首先,我们需要...

    基于eclipse的数据缓存处理插件的设计与实现大学论文.doc

    在这个项目中,可能涉及以下几种数据缓存策略: - **本地缓存**:如使用Java的HashMap或ConcurrentHashMap,存储在JVM内存中。 - **分布式缓存**:如Redis、Memcached,支持多服务器间的共享缓存。 - ** EhCache*...

    hibernate 缓存策略

    3. 调整缓存策略以适应业务需求,例如对于只读数据可设置为`read-only`。 4. 使用缓存时要注意缓存击穿、缓存雪崩和缓存穿透等问题,采取适当的预防措施。 总的来说,理解并合理运用Hibernate的缓存策略,能够显著...

    hibernate缓存策略

    ### Hibernate缓存策略详解 #### 一、理解Hibernate...通过合理配置缓存策略,可以有效提高数据访问效率和应用性能。在实际开发过程中,开发人员应根据具体需求灵活选择合适的缓存策略,以达到最佳的性能优化效果。

    android数据缓存

    综上所述,Android数据缓存是一个综合性的技术,涵盖了多种数据类型的存储、缓存策略的设计以及优化技巧。理解并掌握这些知识点对于提升Android应用的性能和用户体验至关重要。在实际开发中,应根据项目需求选择合适...

    流式数据处理的动态自适应缓存策略研究.pdf

    这种策略的核心思想是根据上游数据流量的变化动态调整数据缓存的大小和参数,以提高系统对环境变化的适应能力,增强流数据缓存处理的实时性和吞吐量性能。 动态自适应缓存策略通常涉及对上游数据流量的实时监控。...

    ASP.NET数据缓存技术

    总结来说,ASP.NET数据缓存技术对于提高Web应用程序的性能至关重要,理解并合理运用缓存策略能有效提升用户体验,同时减轻服务器负担。开发者应根据实际需求选择合适的缓存类型和策略,并持续监控和优化,以达到最佳...

    基于P2P的VOD系统中数据缓存策略研究 (2007年)

    提出了一种结合内存缓存与磁盘缓存的新型缓存策略.该策略在原有内存缓存基础上增加了磁盘缓存,数据从内存中被淘汰时,从磁盘缓存空间中选择合适磁盘分片进行缓存,并建立索引管理已缓存数据,使对等网络中的节点...

    车联网中基于NDN的缓存策略综述.pdf

    作者指出,没有一种缓存策略适用于所有的场景,所以不同的策略可以根据车联网的应用需求、车辆的分布特征、数据的类型和更新频率等因素综合考虑,选择最合适的缓存策略。 综上所述,NDN缓存策略的研究对于提高车...

Global site tag (gtag.js) - Google Analytics