`
doingwell
  • 浏览: 34534 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

WORD文件转换PDF方法1:利用Word转换的效率及适应性研究(JAVA环境)

 
阅读更多

结论:5页文件每页用时153.4ms,1430页文件每页用时141.4ms,差别并不明显。

 

0. 运行环境

既然是利用Microsoft Office word,所以理所当然需要运行在Windows下。测试用的Office版本:2010。

 

1.需要的辅助工具:

由于java环境无法直接调用ActiveX,所以借助于开源的jacob。版本: 1.17。

 

2.代码准备:

这里只列举几个关键步骤吧,完整代码就不列举了,可以自行组合。

 

2.1 创建Word的ActiveX对象

ActiveXComponent app = new ActiveXComponent("Word.Application");  
app.setProperty("Visible", false);  

 

2.2 打开word文档

Dispatch docs = app.getProperty("Documents").toDispatch();  
Dispatch  doc = Dispatch.call(docs,  
                    "Open",  
                    in, // FileName  
                    false, // ConfirmConversions  
                    true // ReadOnly  
                    ).toDispatch(); 

 

2.3 输出为PDF文档

Dispatch.call(doc,  
                    "SaveAs",  
                    out, // FileName  
                    17); 

 

2.4 关闭文档

Dispatch.call(doc, "Close", false);  
doc.safeRelease();

 

 2.5 关闭ActiveX

if (docs != null) {  
    docs.safeRelease();  
}  
if (app != null) {  
   app.invoke("Quit", 0);  
   app.safeRelease();  
} 

 

3. 转换效率

场景1:word文件大小:18.7k,5页。生成pdf后123k。生成的文件不都是相同大小,这个问题还有待研究。处理1024个文件,用时:785555ms,13分5秒。平均每个文件用时:767.1ms。

 

场景2:word文件大小:2.27m,1430页。生成pdf是13.3m。pdf文件还是大小不一。处理4个文件,用时:808589ms,13分28秒。平均每个文件用时:202147ms。

 

可以看出,场景1的5页文件每页用时153.4ms,场景2的1430页文件每页用时141.4ms,差别并不明显。

分享到:
评论

相关推荐

    使用poi根据模版生成word文档并转换成PDF文件

    - 使用转换工具:生成Word文档后,我们需要一个转换工具将Word转换为PDF。常见的工具有iText、Apache PDFBox或者Java的第三方库如Aspose.Words。这里以Apache PDFBox为例,它提供了一个名为`PDDocument`的类来处理...

    java文档excel、word、pdf、ppt转图片

    在Java编程环境中,将文档(如Excel、Word、PDF、PPT)转换为图片是一种常见的需求,这在处理大量文档预览、数据可视化或者移动设备兼容性问题时尤其有用。以下是一些关于如何使用Java实现这种转换的关键知识点: 1...

    Java实现基于web的pdf转word

    有时我们需要在Web环境中将PDF转换为Word,以便进行编辑或适应不同的系统需求。本篇将详细介绍如何使用Java实现在Web项目中进行这样的转换。 首先,我们要理解PDF(Portable Document Format)是一种静态的、不可...

    纯java代码跨平台调用打印机打印word、pdf、图片等。

    综上所述,这个项目展示了如何利用Java的开源库和标准API来构建一个独立且可移植的跨平台打印解决方案,能够处理多种文件格式,包括PDF、Word文档和图片。这对于需要在不同环境中进行文档打印的Java应用来说,具有很...

    Java实现word、excel转pdf、html

    对于Excel转PDF,步骤类似,只是替换`"Word.Application"`为`"Excel.Application"`,并且可能需要调整保存参数以适应Excel文件的特性。 除了Jacob,还有其他Java库如Apache POI和iText可以用来处理这种转换,但它们...

    JAVA将PDF转OFD 国产化必备

    5. **生成OFD文件**:利用OFD SDK的JAVA API,将上述XML数据和资源写入OFD文件中,完成转换。 在实际操作中,需要注意以下几点: - **字体兼容性**:由于PDF可能使用各种字体,而OFD要求使用国标GB2312、GBK或UTF-8...

    POI按word模版生成合同并生成PDF(修复生成pdf功能)

    3. Word到PDF转换:利用iText或PDFBox等库将处理后的Word内容转换为PDF格式。 4. 错误排查和修复:针对生成PDF过程中可能出现的问题进行调试和优化。 理解并掌握这些技术,可以帮助开发者实现高效且灵活的文档自动...

    java word转pdf源码示例

    在Java开发环境中,将Word文档转换为PDF是常见的需求,特别是在处理报告、文档共享或跨平台兼容性问题时。Apache POI和iText是两个常用的库,分别用于处理Microsoft Office格式(如Word)和PDF文档。本示例将介绍...

    ppt,word ,excle,pdf 互转换所需要的jar.rar

    "ppt,word, excel, pdf 互转换所需要的jar.rar" 提供的资源是一个Java Archive (JAR) 文件,它包含了一组库,可以支持开发者在应用程序中实现不同文件格式之间的转换。JAR 文件是一种归档格式,用于收集多个Java类...

    word转pdf及2003和2007共存的方法

    在数字化办公环境中,将Word文档转换为PDF格式是常见需求,尤其是为了确保文档在不同设备上的一致性显示。Office 2007及后续版本内置了直接转换为PDF的功能,极大地简化了这一过程。 **1. 安装Office 2007** 首先...

    word转PDF然后实现在线预览的功能.rar

    在IT行业中,将Word文档转换为PDF格式并实现在线预览功能是一项常见的需求,尤其在Web应用中。这个压缩包“word转PDF然后实现在线预览的功能.rar”提供了一个技术解决方案,下面我们将深入探讨其中涉及的关键知识点...

    基于java的word转pdf工具

    基于Java的Word转PDF工具,能够方便地将Microsoft Word文档转换为PDF格式,这在跨平台的文档共享、打印预览以及确保一致的视觉效果时特别有用。在描述中提到了几个关键特性: 1. **自带字体库**:这意味着该工具...

    ireport导出pdf和word文档实例

    通过以上的步骤和技巧,你可以使用`iReport`有效地创建和导出PDF及Word文档,满足不同场景的需求。尽管过程中可能遇到一些挑战,但只要掌握了基本操作和解决方法,就能够高效地完成任务。在实际工作中,不断实践和...

    java word mathml Latex ooxml 互转

    LaTeX到Word的转换可能需要先将LaTeX编译为PDF,然后使用PDF到Word的转换工具,或者将LaTeX公式转换为MathML,再用Apache POI写入Word文档。 5. **实际应用** - 这些转换在教育、科研和出版等领域有广泛应用。例如...

    wordpdf.rar

    在实际操作中,将Word文档转换为PDF的原因可能包括保持格式的一致性、防止内容被轻易编辑或为了适应不同的设备和操作系统。这个过程可以通过各种工具实现,包括免费和付费的在线服务,以及利用编程语言编写的自定义...

    使用java将多种类型的文件如Word、PDF、JPG汇总到一个文档中(Word或者PDF)

    在IT行业中,经常需要处理各种类型的文件,例如Word文档、PDF和图片等。有时,我们需要将这些不同格式的文件合并到一个文档中,以便于阅读、管理和分享。本篇文章将详细讲解如何使用Java编程语言来实现这个功能,将...

    jacob-1.15 java转word、pdf桥梁

    总的来说,Jacob-1.15是一个强大的工具,使得Java开发者能够方便地在应用程序中集成文档处理功能,特别是需要在Java应用中创建、编辑或转换Word和PDF文件的场景。尽管存在一些挑战,但它为开发者提供了一个有效的...

    java中 jacob各个版本jar及相应的dll文件,能适应各种jdk ,word转pdf,图片转pdf

    - 最后,使用Word的`SaveAs`方法,将文档保存为PDF格式。这个过程需要设置正确的文件路径和保存类型。 2. **图片转PDF**: - 对于图片转PDF,由于Jacob主要针对Office文档,不直接支持图片操作。但你可以先将图片...

    word_pdf操作jar.zip

    标题“word_pdf操作jar.zip”指的是一个压缩包文件,该文件包含了处理Word和PDF文档转换的Java类库。这个压缩包可能是一个集合,用于帮助开发者实现文档格式的互换,如将Word文档转换为PDF,或者将PDF转换为图片等。...

    word转PDF相关JAR包.zip

    在IT行业中,转换文档格式是一项常见的任务,尤其是在处理Word文档和PDF文档时。"word转PDF相关JAR包.zip"这个压缩包提供了Java开发者所需的一些关键库,使得在应用程序中实现Word到PDF的转换成为可能。以下是这些库...

Global site tag (gtag.js) - Google Analytics