结论:处理的文件越大,单页输出效率越高,4页文件的平均效率:151ms/page,1311页文件的平均效率:38.3ms/page。处理效率和文字编码无明显关联。(查看word测试结果)
0.运行环境
需要运行在windows环境下,原因当下wps的linux版本还处在beta阶段,所以不推荐使用。笔者所使用的wps为2012个人版。“wps文字”版本号:8.1.0.3526
1.需要的辅助工具:
由于java环境无法直接调用ActiveX,所以借助于开源的jacob。版本: 1.17
2.代码准备:
这里只列举几个关键步骤吧,完整代码就不列举了,可以自行组合。
2.1 创建WPS文字的ActiveX对象
ActiveXComponent app = new ActiveXComponent("WPS.Application"); //后台转换,隐藏界面 app.setProperty("Visible", false);
2.2 打开txt文档
//获取到所有文档对象 Dispatch documents=app.getProperty("Documents").toDispatch(); //open 有15个参数,第一个是打开文档文件名,最后一个控制是否【不显示】编码选择对话框 Object[] attr=new Object[15]; attr[0]=in; attr[14]=true; Dispatch doc = Dispatch.call(documents, "open",attr).toDispatch();
2.3 输出为pdf文档
Dispatch.call(doc, "ExportPdf",out);
2.4 关闭文档
Dispatch.call(doc, "Close", 0);
2.5 关闭WPS文字的ActiveX对象
Dispatch.call(documents, "Close", 0); documents.safeRelease(); Dispatch.call(app, "Quit", 0); app.safeRelease();
3. 转换效率
场景1:txt文件大小:5.02k,GBK编码。生成pdf后109k,4页。处理1024个文件,用时:618026毫秒,10分钟。平均每个文件用时:603.5ms。
场景2:txt文件大小:6.04k,UTF-8编码。生成pdf后依然是109k,4页。处理1024个文件,用时:617839毫秒,10分钟。平均每个文件用时:603.4ms。和场景1的结果无明显差别。
场景3:txt文件大小:2.42m,GBK编码。生成pdf后4.56m,1311页。处理16个文件,用时:803473毫秒,13分钟。平均每个文件用时:50217ms。
从以上结果分析出,处理的文件越大,单页输出效率越高,4页文件的平均效率:151ms/page,1311页文件的平均效率:38.3ms/page。处理效率和文字编码无明显关联。
4. 适应性分析:
4.1 文件占用
由于采用了只读方式打开txt文件,所以不受文件是否被其他程序打开的影响。
4.2 文字编码
文字编码由WPS来判断,可以根据文字内容来判断编码。
相关推荐
总的来说,实现这些转换涉及的技术包括:Java编程、Apache POI、WPS SDK(如果适用)、iText、PDFBox、Aspose.Words(或其他类似库)以及Jacob。每个库或工具都有其特定的用法和优点,开发者应根据实际需求选择最...
总的来说,Java调用WPS实现Word到PDF和Word到图片的转换涉及技术包括:Java编程、API接口调用、文件格式转换、图像处理等。这需要对Java和WPS API有深入理解,同时熟悉文档处理和格式转换的相关知识。通过合理利用...
通过以上知识点,开发者可以了解如何在Java环境中利用WPS或PDFCreator的COM接口实现doc到pdf的转换。不过,需要注意的是,这种方案依赖于特定的Windows组件,可能会带来一些限制和挑战。在实际项目中,应根据需求、...
标题提到的"PDF,EXCEL,WORD,WPS,PPT转换为txt文件"是指将这些常见办公软件的文件格式转换成纯文本(txt)格式。这样的转换对于数据提取、文本分析、文件归档等应用场景非常有用。以下是对这些知识点的详细解释: 1....
在IT行业中,转换Office文档为PDF格式是一种常见的需求,特别是在文档分发、打印或保持格式一致性时。"使用jacob转换office为PDF"是解决这一问题的一种方法。JACOB(Java COM Bridge)是一个Java库,它允许Java应用...
尽管LibreOffice在功能和稳定性方面有显著提升,但如果你的环境中已经有OpenOffice,也可以使用相同的方法进行文档转换。只是在安装和更新时,需要寻找相应的OpenOffice软件包和命令。 通过熟练掌握这些步骤,你...
【标题】"wpsoffice在线预览,在线编辑 Java版"所涉及的知识点主要集中在如何在Java环境中实现对WPS Office文档的在线预览和编辑功能。WPS Office是一款流行的办公软件套装,包含了文字处理、电子表格和演示文稿等...
标题 "wps转pdf.rar" 涉及到的技术点主要集中在将WPS文档转换成PDF格式,这个过程通常在Windows环境下使用WPS的COM组件完成,而在Linux环境中则推荐使用OpenOffice作为解决方案。让我们详细探讨一下这些知识点。 1....
安装完成后,重新启动电脑,打印机中就有导出WPS PDF虚拟打印机了。 自解压文件里面只有7个文件。文件大小1.62MB,不到2M的大小。 其中6个是C:\Windows\system32\spool\DRIVERS\x64\3文件夹中的必要系统文件, 主要...
为了帮助开发者利用WPS进行定制化开发,Kingsoft公司推出了一个名为“WPS二次开发包”的工具,特别适用于Java开发环境。这个开发包为Java程序员提供了接口和工具,以便将WPS的功能集成到自己的应用程序中。 首先,...
"基于Java实现wps在线编辑、在线预览后台服务"这个标题指出,我们将探讨一个使用Java编程语言构建的系统,该系统能够支持WPS文档的在线编辑和预览功能。这意味着该服务可能是一个Web应用程序,它允许用户在浏览器中...
WPS组件可能不直接支持Word到PDF的转换,但你可以先将Word转换为HTML,然后利用其他库(如iTextSharp)将HTML转换为PDF。 6. **Excel到PDF转换**: 同样,可能需要第三方库,如Aspose.Cells,来完成Excel到PDF的...
在IT行业中,转换文档格式是一项常见的任务,尤其是将办公文档如WPS转换为PDF格式,因为PDF具有良好的兼容性和稳定性。本项目名为“wps 转 pdf C# 源码”,它提供了使用C#编程语言调用WPS API来实现此功能的方法。...
在现代办公环境中,文件格式转换是一项常见的任务,尤其在跨平台和设备共享文档时,PDF(Portable Document Format)因其良好的兼容性和阅读体验而备受青睐。本文将详细介绍如何使用WPS来实现多种文件类型,如DOC、...
3. **编程实现**:对于批量转换或自动化需求,可以编写脚本利用API或库(如Python的`lxml`或Java的`JDOM`)读取Wps文件内容并生成XML。 **注意事项** 1. **数据丢失**:并非所有Wps文件的格式特性都能完全保留在XML...
本主题聚焦于如何在C#环境下实现WPS文档转换为PDF的功能。WPS Office是一款与Microsoft Office类似的应用,它包括Word处理、电子表格和演示文稿等组件,而PDF(Portable Document Format)则是一种通用的文件格式,...
计算机等级知识辅导:利用 WPS 表格检测输入数据的正确性 本文档主要介绍了如何使用 WPS 表格检测输入数据的正确性,避免数据录入错误的影响。文章通过多个实例,展示了 WPS 表格的“数据有效性”功能,可以有效地...
C#通过COM调用WPS将Office文档转换为PDF源码,源码参考学习使用。
"wps-view-java-master"部分暗示这是一个使用Java语言开发的主分支项目,可能是一个服务器端应用,用于支持用户在Web环境下实时编辑和预览WPS文档。 【描述解析】 "基于wps在线编辑、在线预览后台服务"描述进一步...