`
ext2xhb
  • 浏览: 9746 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

使用CXF附件的注意事项

阅读更多
英文链接http://ext2xhb.wordpress.com/2011/06/08/using-cxf-attachment-safely/

Apache CXF引擎处理附件的机制十分的优化,而且支持大附件的使用模式。不过如果使用时不太注意,可能会引发一些潜在的问题。譬如:临时文件没有删除,http连接没有释放。

最近通过查看了CXF的源代码,以及和CXF社区交流以后。总结了一下CXF附件的使用注意事项,这些事项可以通过以下几个问题分别说明。
1)如何避免残留临时文件/如何避免http连接的没有正确关闭。
2)附件的内容如何重复使用
3)如何处理大附件。

在分析这些问题之前,我们需要了解一下关于CXF处理附件的一些基本知识。
1)CXF的附件具有两个底层的状态:"cached" and "delegate";
"cached"意味着附件的内容已经从网络上读取完毕,并且缓冲到内存或者临时文件中。如果附件的大小超过了一个“阈值”,那么CXF使用临时文件保存附件内容,否则使用内存保存。因此在客户端程序中调用DataSource.getInputStream()会返回一个指向内存或者临时文件的InputStream。

"delegate" 意味着附件的内容依然在网络上保持着未读取的状态。此时数据源的输入流最终会关联一个Http-Connection的输入流。

2)只有最后一个附件的状态时“delegate”,其他附件的状态都是“cached”
如果Webservice只有一个附件,那么这个附件的状态是“delegate”。如果有多个,那么只有最后一个是delegate。

到2.4.0的Release版本为止,由于CXF与SUN的Activation 库不兼容,从而导致附件的状态不正确(都是“delegate")。因此我们需要将CXF3505https://issues.apache.org/jira/browse/CXF-3505的patch自行合并到CXF库中。在未来版本,CXF会将此问题的Patch合并到发布版本中。

3)CXF 重载了"cached" 附件的input stream close方法。关闭附件是关联的临时文件会删除。


下面我们看一下如何解决前面提出的问题。

1)如何避免残留临时文件/如何避免http连接的没有正确关闭。
前面提到过"cached" 附件可能会关联一个临时文件,而"delegate"附件则会关联一个网络输入流。所以如果我们不正确的释放附件,那么可能会导致残留临时文件或者没有管理底层的http连接。
CXF要求用户必须自行维护附件的释放过程。也就是说,即使用户不关心附件内容的时候,他也必须从附件的获得InputStream(DataSource.getInputStream()),然后显示的关闭它(inputstream.close)
注意:CXF3504 https://issues.apache.org/jira/browse/CXF-3504是一个与附件关闭有关的问题。如果我们没有将此问题的补丁合并到cxf,那么在关闭InputStream之前,最好将其中的内容完全读取完毕。
void safeClose(InputStream is) throws IOException{
try{
while(is.read() != -1)
;
}catch(Exception e){
//ignore
}
is.close();
}
CXF3504的问题实际上只影响"delegate"状态的附件,也就是说我们实际上只需要对“delegate”状态的附件的关闭做上述处理。如果我们关心效率并且不介意使用CXF内部API,那么可以参考后面的代码实例,来判断附件是否是“delegate”状态。

1.1) 服务端附件的清理机制
当编写web服务的时候,我们会希望当应答返回完毕后, 请求的附件会被自动清理掉。此时我们可以自己编写一个Interceptor来做自动清理的工作。

注意:这种做法只适用于InOut MEP的webservice方法。

首先我们需要为此Interceptor指定一个合适的Phase。由于请求的附件可能被用在应答中,因此我们指定的Phase必须是在应答发送完毕之后。 因此可以使用PREPARE_SEND_ENDING

public AttachmentCleanInterceptor() {
  super(Phase.PREPARE_SEND_ENDING);
}

接着我们需要使用CXF的底层API来访问附件的输入流并关闭它,从而释放附件。这里判断了CXF附件是否为delegate状态,对于delegate状态的附件会在关闭输入流之前将其中的内容完全读完(原因是我们前面提到的CXF3504问题)。

private void cleanRequestAttachment(Exchange exchange) {
  Collection<Attachment> inAttachments = exchange.getInMessage().getAttachments();
  if(inAttachments != null){
    for(Attachment attachment : inAttachments){
      cleanRequestAttachment(attachment);
    }
  }
}

protected void cleanRequestAttachment(Attachment attachment){
  DataSource ds = attachment.getDataHandler().getDataSource();
  if(ds instanceof LazyDataSource){
    ds = ((LazyDataSource)ds).getDataSource();
  }
  if(ds instanceof AttachmentDataSource){
    InputStream is = ds.getInputStream();
    //input stream maybe still delegate to network, so we need to consume it all then close it
    if(!ds.isCached()){
      while(is.read() >= 0){
      }
    }
    //close will delete resource(etc: temporary file) holded by the input stream;
    is.close();
  }
}

接着我们需要将interceptor配置在webservice的out以及outFault interceptor中: <jaxws:outInterceptors>
<refer bean="attachmentClean"/>
</jaxws:outInterceptors>
<jaxws:outFaultInterceptors>
<refer bean="attachmentClean"/>
</jaxws:outFaultInterceptors>

1.2) 客户端的附件清理机制
在客户端,“清理附件”的问题会更加严重。如果忘记关闭附件,会导致http连接无法关闭。这是因为“delegate”状态的附件关联了http response的输入流。因此如果用户不关闭,那么cxf就没有机会来关闭http连接。
void safeClose(DataSource ds, InputStream is){
  if(ds instanceof AttachmentDataSource){
    if(!ds.isCached()){
      while(is.read() >= 0){
      }
    }
  }
  //close will delete resource(etc: temporary file/) holded by the input stream;
  is.close();
}



2)附件的内容如何重复使用
我是在一个代理服务中首次发现这个问题的。这个代理服务会将请求的附件转发给多个web service。结果有时候,代理程序只能将附件内容成功的发送给第一个webservice,而发送给其他webservice的内容为空。
原因在于:1)"delegate"状态的附件关联底层输入流,因此只能读一次。2)"cached"状态的附件可能关联临时文件,读完关闭以后临时文件将被删除,并且附件的内容被重置为一个空的内容。所以下次读的时候就会为空。

因此为了能够多次读取附件内容,需要我们预先将附件的输入流备份一下。但是这种做法效率不高,尤其是附件内容过大时。而CXF提供了特殊的API,可以将附件的内容“hold”住。“hold”的意思是:附件的内容将被保留,用户可以安全的多次读取附件内容。
需要注意的是,如果我们将附件“hold”住,附件关联的临时文件就无法被删除。当需要删除时,我们需要预先将其"release”。然后在使用关闭流的方式删除附件。

下面的程序演示了如何"hold"和"release"附件:

//locking will avoid to copy data source for reuse;
void lock(DataSource ds) throws IOException {
  AttachmentDataSource ads = getAttachmentDataSource(ds);
  if (ads != null) {
   // tell attachment to hold the temporary file;
   ads.hold();
  }
}

void release(DataSource ds) throws IOException {
  AttachmentDataSource ads = getAttachmentDataSource(ds);
  if (ads != null) {
   // tell attachment to hold the temporary file;
   ads.release();
  }
}
// get underlying attachment data source
protected AttachmentDataSource getAttachmentDataSource(DataSource ds) {
  if (ds instanceof LazyDataSource) {
   ds = ((LazyDataSource) ds).getDataSource();
  }
  if (ds instanceof AttachmentDataSource) {
   return (AttachmentDataSource) ds;
  }
  return null;
}

3)如何处理大附件。

3.1)使用附件保存大批业务数据的情况
当使用webservice的时候,soap xml中包含的业务数据的最大size最好是可以预期的,并控制在一个合理的范围内。如果业务数据的大小不可预计,当过大时会导致webservice的性能很差,严重的还会导致内存溢出。
实际上很难说webservice这种技术是否适合这种场景。不过如果一定需要使用webservice的时候,那么最好使用附件来保存此类业务数据。

下面我们看一个处理此类附件的简单示例:

void largeBusinessDataUpload(..){

InputStream is = attachmentDataSource.getInputStream();

Record businessRecord;

while((businessRecord = parseRecord(is)) != null){

//process a businessRecord . etc: saving it to a database;

}

is.close();

}

上面这个简单的程序存在一个性能瓶颈——服务端的业务数据处理速度比网络传输速度慢的时候。服务端会导致客户端在发送附件的过程中阻塞。此时客户端无法进行其他处理降低了客户端的执行效率,同时网络传输故障的可能性也会增加。

要解决这个问题,我们需要首先将附件的内容备份到下来(比如一个临时文件中),然后在备份内容中读取数据并处理。
不过当使用CXF的时候,我们实际上可以通过强迫附件进入“cache”状态来解决这个问题。
AttachmentDataSource.cache()可以达到此目的。

典型的在下面的场景下,进行上述处理会提高webservice性能
a)one-way模式下,客户端发送大附件到服务端。
b)客户端接收来自服务的大附件。

3.2) 二进制大附件

附件可以用来传输二进制数据——比如图片等。但是当二进制数据过大时,我们需要启用Http的“chuncked”模式来传输附件。
如果不启用,CXF引擎需要复制附件的内容来构成一个完整的MIME 编码的SOAP数据包后才能发送,整个MIME 数据包(包括soap-envelop以及所有附件内容的MIME数据包)。而启用了chunked模式后,CXF可以一边读取附件内容一边发送,无需单独构造一个完整的MIME数据包。

我们必须在客户端启用chunked模式,而服务端会自动在发送应答时确定是否使用chunked模式(几乎所有应用web服务器会在应答数据超过一定大小后,自动启用chunked)。
static private void setChunkThreshold(Object client, int size){
  HTTPClientPolicy httpClientPolicy = getClientPolicy(client);
  httpClientPolicy.setChunkingThreshold(size);
}
private static HTTPClientPolicy getClientPolicy(Object stub) {
  org.apache.cxf.endpoint.Client client = org.apache.cxf.frontend.ClientProxy.getClient(stub);
  HTTPConduit http = (HTTPConduit) client.getConduit();
  if(http.getClient() == null){
    HTTPClientPolicy httpClientPolicy = new HTTPClientPolicy();
    http.setClient(httpClientPolicy);
  }
  return http.getClient();
}
分享到:
评论

相关推荐

    实时监控体系:基于Prometheus的API性能指标可视化方案.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    5个提升DeepSeekAPI生成质量的调参技巧,开发者必看!.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    ACM动态规划模板-区间修改线段树问题模板

    ACM动态规划模板-区间修改线段树问题模板

    深度解析C语言调试技巧:VSCode+GDB实战排错指南.pdf

    # 踏入C语言的奇妙编程世界 在编程的广阔宇宙中,C语言宛如一颗璀璨恒星,以其独特魅力与强大功能,始终占据着不可替代的地位。无论你是编程小白,还是有一定基础想进一步提升的开发者,C语言都值得深入探索。 C语言的高效性与可移植性令人瞩目。它能直接操控硬件,执行速度快,是系统软件、嵌入式开发的首选。同时,代码可在不同操作系统和硬件平台间轻松移植,极大节省开发成本。 学习C语言,能让你深入理解计算机底层原理,培养逻辑思维和问题解决能力。掌握C语言后,再学习其他编程语言也会事半功倍。 现在,让我们一起开启C语言学习之旅。这里有丰富教程、实用案例、详细代码解析,助你逐步掌握C语言核心知识和编程技巧。别再犹豫,加入我们,在C语言的海洋中尽情遨游,挖掘无限可能,为未来的编程之路打下坚实基础!

    10个高效调用DeepSeekAPI的技巧:从请求优化到缓存策略.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    基于Python语言的PersonRelationKnowledgeGraph设计源码

    本项目为Python语言开发的PersonRelationKnowledgeGraph设计源码,总计包含49个文件,涵盖19个.pyc字节码文件、12个.py源代码文件、8个.txt文本文件、3个.xml配置文件、3个.png图片文件、2个.md标记文件、1个.iml项目配置文件、1个.cfg配置文件。该源码库旨在构建一个用于表示和查询人物关系的知识图谱系统。

    成本优化指南:通过Token计算模型将API费用降低57%的秘诀.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    大华智能物联平台,的对接其他接口的API,可以获得视频拉流的flv/hls/rstp 的拉流地址,demo项目为springBoot项目,可以通过摄像头的视频通道,获取到实时拉流的uRl

    rtsp实时预览接口URL:/evo-apigw/admin/API/MTS/Video/StartVideo HLS、FLV、RTMP实时预览接口方式 :接口URL/evo-apigw/admin/API/video/stream/realtime 参数名 必选 类型 说明 data true string Json串 +channelId true string 视频通道编码 +streamType true string 码流类型:1=主码流, 2=辅码流,3=辅码流2 +type true string 协议类型:hls,hlss,flv,flvs,ws_flv,wss_flv,rtmp hls:http协议,m3u8格式,端口7086; hlss:https协议,m3u8格式,端口是7096; flv:http协议,flv格式,端口7886; flvs:https协议,flv格式,端口是7896; ws_flv:ws协议,flv格式,端口是7886; wss_flv:wss协议,flv格式,端口是7896; rtmp:rtmp协议,端口是1975;

    Simulink永磁风机飞轮储能系统二次调频技术研究:频率特性分析与参数优化,Simulink永磁风机飞轮储能二次调频技术:系统频率特性详解及参数优化研究参考详实文献及两区域系统应用,simulink

    Simulink永磁风机飞轮储能系统二次调频技术研究:频率特性分析与参数优化,Simulink永磁风机飞轮储能二次调频技术:系统频率特性详解及参数优化研究参考详实文献及两区域系统应用,simulink永磁风机飞轮储能二次调频,系统频率特性如下,可改变调频参数改善频率。 参考文献详细,两区域系统二次调频。 ,核心关键词: 1. Simulink 2. 永磁风机 3. 飞轮储能 4. 二次调频 5. 系统频率特性 6. 调频参数 7. 改善频率 8. 参考文献 9. 两区域系统 以上关键词用分号(;)分隔,结果为:Simulink;永磁风机;飞轮储能;二次调频;系统频率特性;调频参数;改善频率;参考文献;两区域系统。,基于Simulink的永磁风机与飞轮储能系统二次调频研究:频率特性及调频参数优化

    MATLAB驱动的ASR防滑转模型:PID与对照控制算法对比,冰雪路面条件下滑移率与车速轮速对照展示,MATLAB驱动的ASR防滑转模型:PID与对照控制算法对比,冰雪路面条件下滑移率与车速轮速对照图

    MATLAB驱动的ASR防滑转模型:PID与对照控制算法对比,冰雪路面条件下滑移率与车速轮速对照展示,MATLAB驱动的ASR防滑转模型:PID与对照控制算法对比,冰雪路面条件下滑移率与车速轮速对照图展示,MATLAB驱动防滑转模型ASR模型 ASR模型驱动防滑转模型 ?牵引力控制系统模型 选择PID控制算法以及对照控制算法,共两种控制算法,可进行选择。 选择冰路面以及雪路面,共两种路面条件,可进行选择。 控制目标为滑移率0.2,出图显示车速以及轮速对照,出图显示车辆轮胎滑移率。 模型简单,仅供参考。 ,MATLAB; ASR模型; 防滑转模型; 牵引力控制系统模型; PID控制算法; 对照控制算法; 冰路面; 雪路面; 控制目标; 滑移率; 车速; 轮速。,MATLAB驱动的ASR模型:PID与对照算法在冰雪路面的滑移率控制研究

    芯片失效分析方法介绍 -深入解析芯片故障原因及预防措施.pptx

    芯片失效分析方法介绍 -深入解析芯片故障原因及预防措施.pptx

    4131_127989170.html

    4131_127989170.html

    PostgreSQL自动化部署与优化脚本:智能化安装、安全加固与监控集成

    内容概要:本文提供了一个全面的PostgreSQL自动化部署解决方案,涵盖智能环境适应、多平台支持、内存与性能优化以及安全性加强等重要方面。首先介绍了脚本的功能及其调用方法,随后详细阐述了操作系统和依赖软件包的准备过程、配置项的自动生成机制,还包括对实例的安全性和监控功能的强化措施。部署指南给出了具体的命令操作指导,便于新手理解和执行。最后强调了该工具对于不同硬件条件和服务需求的有效应对能力,特别是针对云计算环境下应用的支持特点。 适合人群:对PostgreSQL集群运维有一定基础并渴望提高效率和安全性的数据库管理员及工程师。 使用场景及目标:本脚本能够帮助企业在大规模部署时减少人工介入时间,确保系统的稳定性与高性能,适用于各类需要稳定可靠的数据库解决方案的企业或机构,特别是在大数据量和高并发事务处理场合。 其他说明:文中还提及了一些高级功能如自动备份、流复制等设置步骤,使得该方案不仅可以快速上线而且能满足后续维护和发展阶段的要求。同时提到的技术性能数据也为用户评估其能否满足业务需求提供了直观参考。

    房地产开发合同[示范文本].doc

    房地产开发合同[示范文本].doc

    成本优化实战:DeepSeekAPI的Tokens计算与计费策略拆解.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    安全必读:DeepSeek接口调用中的数据加密与合规实践.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    工程技术承包合同[示范文本].doc

    工程技术承包合同[示范文本].doc

    蓝桥杯开发赛作品源码【基于C语言】

    蓝桥杯开发赛【作品源码】

    深度解析DeepSeek语义分析API:实现情感分析与意图识别的进阶技巧.pdf

    在日常的工作和学习中,你是否常常为处理复杂的数据、生成高质量的文本或者进行精准的图像识别而烦恼?DeepSeek 或许就是你一直在寻找的解决方案!它以其高效、智能的特点,在各个行业都展现出了巨大的应用价值。然而,想要充分发挥 DeepSeek 的优势,掌握从入门到精通的知识和技能至关重要。本文将从实际应用的角度出发,为你详细介绍 DeepSeek 的基本原理、操作方法以及高级技巧。通过系统的学习,你将能够轻松地运用 DeepSeek 解决实际问题,提升工作效率和质量,让自己在职场和学术领域脱颖而出。现在,就让我们一起开启这场实用又高效的学习之旅吧!

    CVPR2023复现技术:多数据集验证下的YOLOX、YOLOv5及YOLOV7检测涨点助力器,CVPR2023复现实验助力检测涨点,验证了YOLOX、YOLOv5及YOLOV7在多个数据集上的有效性

    CVPR2023复现技术:多数据集验证下的YOLOX、YOLOv5及YOLOV7检测涨点助力器,CVPR2023复现实验助力检测涨点,验证了YOLOX、YOLOv5及YOLOV7在多个数据集上的有效性,cvpr2023复现,助力检测涨点,YOLOX YOLOv5 YOLOV7均有效,再多个数据集验证有效 ,cvpr2023复现; 助力检测涨点; YOLOX有效; YOLOv5有效; YOLOV7有效; 多数据集验证有效,CVPR2023复现成功:多模型检测涨点验证有效

Global site tag (gtag.js) - Google Analytics