`
doingwell
  • 浏览: 34575 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

TXT转换PDF方法1:利用WPS转换的效率及适应性研究(JAVA环境)

阅读更多

结论:处理的文件越大,单页输出效率越高,4页文件的平均效率:151ms/page,1311页文件的平均效率:38.3ms/page。处理效率和文字编码无明显关联。(查看word测试结果

 

0.运行环境

需要运行在windows环境下,原因当下wps的linux版本还处在beta阶段,所以不推荐使用。笔者所使用的wps为2012个人版。“wps文字”版本号:8.1.0.3526

 

1.需要的辅助工具:

由于java环境无法直接调用ActiveX,所以借助于开源的jacob。版本: 1.17

 

2.代码准备:

这里只列举几个关键步骤吧,完整代码就不列举了,可以自行组合。

2.1 创建WPS文字的ActiveX对象

ActiveXComponent app = new ActiveXComponent("WPS.Application");
//后台转换,隐藏界面
app.setProperty("Visible", false);
 

 

2.2 打开txt文档

//获取到所有文档对象
Dispatch documents=app.getProperty("Documents").toDispatch();
//open 有15个参数,第一个是打开文档文件名,最后一个控制是否【不显示】编码选择对话框
Object[] attr=new Object[15];
attr[0]=in;
attr[14]=true;
Dispatch doc = Dispatch.call(documents, "open",attr).toDispatch();

 

2.3 输出为pdf文档

Dispatch.call(doc, "ExportPdf",out);

 

2.4 关闭文档

Dispatch.call(doc, "Close", 0);

 

2.5 关闭WPS文字的ActiveX对象

 

Dispatch.call(documents, "Close", 0);
documents.safeRelease();
Dispatch.call(app, "Quit", 0);
app.safeRelease();

 

3. 转换效率

场景1:txt文件大小:5.02k,GBK编码。生成pdf后109k,4页。处理1024个文件,用时:618026毫秒,10分钟。平均每个文件用时:603.5ms。

 

场景2:txt文件大小:6.04k,UTF-8编码。生成pdf后依然是109k,4页。处理1024个文件,用时:617839毫秒,10分钟。平均每个文件用时:603.4ms。和场景1的结果无明显差别。

 

场景3:txt文件大小:2.42m,GBK编码。生成pdf后4.56m,1311页。处理16个文件,用时:803473毫秒,13分钟。平均每个文件用时:50217ms。

 

从以上结果分析出,处理的文件越大,单页输出效率越高,4页文件的平均效率:151ms/page,1311页文件的平均效率:38.3ms/page。处理效率和文字编码无明显关联。

 

4. 适应性分析:

4.1 文件占用

由于采用了只读方式打开txt文件,所以不受文件是否被其他程序打开的影响。

4.2 文字编码

文字编码由WPS来判断,可以根据文字内容来判断编码。

分享到:
评论

相关推荐

    java实现office、wps转pdf,pdf转word

    总的来说,实现这些转换涉及的技术包括:Java编程、Apache POI、WPS SDK(如果适用)、iText、PDFBox、Aspose.Words(或其他类似库)以及Jacob。每个库或工具都有其特定的用法和优点,开发者应根据实际需求选择最...

    java调用wps,实现word转pdf,word转图片等

    总的来说,Java调用WPS实现Word到PDF和Word到图片的转换涉及技术包括:Java编程、API接口调用、文件格式转换、图像处理等。这需要对Java和WPS API有深入理解,同时熟悉文档处理和格式转换的相关知识。通过合理利用...

    java调用WPS或pdfcreator的com接口实现doc转pdf

    通过以上知识点,开发者可以了解如何在Java环境中利用WPS或PDFCreator的COM接口实现doc到pdf的转换。不过,需要注意的是,这种方案依赖于特定的Windows组件,可能会带来一些限制和挑战。在实际项目中,应根据需求、...

    PDF,EXCEL,WORD,WPS,PPT转换为txt文件

    标题提到的"PDF,EXCEL,WORD,WPS,PPT转换为txt文件"是指将这些常见办公软件的文件格式转换成纯文本(txt)格式。这样的转换对于数据提取、文本分析、文件归档等应用场景非常有用。以下是对这些知识点的详细解释: 1....

    使用jacob转换office为PDF

    在IT行业中,转换Office文档为PDF格式是一种常见的需求,特别是在文档分发、打印或保持格式一致性时。"使用jacob转换office为PDF"是解决这一问题的一种方法。JACOB(Java COM Bridge)是一个Java库,它允许Java应用...

    centos安装LibreOffice实现word转换PDF操作

    尽管LibreOffice在功能和稳定性方面有显著提升,但如果你的环境中已经有OpenOffice,也可以使用相同的方法进行文档转换。只是在安装和更新时,需要寻找相应的OpenOffice软件包和命令。 通过熟练掌握这些步骤,你...

    wpsoffice在线预览,在线编辑 Java版

    【标题】"wpsoffice在线预览,在线编辑 Java版"所涉及的知识点主要集中在如何在Java环境中实现对WPS Office文档的在线预览和编辑功能。WPS Office是一款流行的办公软件套装,包含了文字处理、电子表格和演示文稿等...

    wps转pdf.rar

    标题 "wps转pdf.rar" 涉及到的技术点主要集中在将WPS文档转换成PDF格式,这个过程通常在Windows环境下使用WPS的COM组件完成,而在Linux环境中则推荐使用OpenOffice作为解决方案。让我们详细探讨一下这些知识点。 1....

    安装WPS PDF虚拟打印机 打印机添加导出WPS PDF或导出金山 PDF

    安装完成后,重新启动电脑,打印机中就有导出WPS PDF虚拟打印机了。 自解压文件里面只有7个文件。文件大小1.62MB,不到2M的大小。 其中6个是C:\Windows\system32\spool\DRIVERS\x64\3文件夹中的必要系统文件, 主要...

    用java进行WPS的二次开发包

    为了帮助开发者利用WPS进行定制化开发,Kingsoft公司推出了一个名为“WPS二次开发包”的工具,特别适用于Java开发环境。这个开发包为Java程序员提供了接口和工具,以便将WPS的功能集成到自己的应用程序中。 首先,...

    基于Java实现wps在线编辑、在线预览后台服务.zip

    "基于Java实现wps在线编辑、在线预览后台服务"这个标题指出,我们将探讨一个使用Java编程语言构建的系统,该系统能够支持WPS文档的在线编辑和预览功能。这意味着该服务可能是一个Web应用程序,它允许用户在浏览器中...

    c#调用wps组件进行文件转换,如html与word,excel互转

    WPS组件可能不直接支持Word到PDF的转换,但你可以先将Word转换为HTML,然后利用其他库(如iTextSharp)将HTML转换为PDF。 6. **Excel到PDF转换**: 同样,可能需要第三方库,如Aspose.Cells,来完成Excel到PDF的...

    wps 转 pdf C# 源码

    在IT行业中,转换文档格式是一项常见的任务,尤其是将办公文档如WPS转换为PDF格式,因为PDF具有良好的兼容性和稳定性。本项目名为“wps 转 pdf C# 源码”,它提供了使用C#编程语言调用WPS API来实现此功能的方法。...

    使用wps实现多种文件转换成PDF

    在现代办公环境中,文件格式转换是一项常见的任务,尤其在跨平台和设备共享文档时,PDF(Portable Document Format)因其良好的兼容性和阅读体验而备受青睐。本文将详细介绍如何使用WPS来实现多种文件类型,如DOC、...

    Wps转换为xml文件

    3. **编程实现**:对于批量转换或自动化需求,可以编写脚本利用API或库(如Python的`lxml`或Java的`JDOM`)读取Wps文件内容并生成XML。 **注意事项** 1. **数据丢失**:并非所有Wps文件的格式特性都能完全保留在XML...

    C#的wps转PDF类

    本主题聚焦于如何在C#环境下实现WPS文档转换为PDF的功能。WPS Office是一款与Microsoft Office类似的应用,它包括Word处理、电子表格和演示文稿等组件,而PDF(Portable Document Format)则是一种通用的文件格式,...

    计算机等考一级知识辅导:利用WPS表格检测输入数据的正确性.docx

    计算机等级知识辅导:利用 WPS 表格检测输入数据的正确性 本文档主要介绍了如何使用 WPS 表格检测输入数据的正确性,避免数据录入错误的影响。文章通过多个实例,展示了 WPS 表格的“数据有效性”功能,可以有效地...

    C#通过COM调用WPS将Office文档转换为PDF源码.7z

    C#通过COM调用WPS将Office文档转换为PDF源码,源码参考学习使用。

    基于wps在线编辑wps-view-java-master

    "wps-view-java-master"部分暗示这是一个使用Java语言开发的主分支项目,可能是一个服务器端应用,用于支持用户在Web环境下实时编辑和预览WPS文档。 【描述解析】 "基于wps在线编辑、在线预览后台服务"描述进一步...

Global site tag (gtag.js) - Google Analytics