word或Excel程序是以一种COM组件的形式存在的。如果能从Java中调用word的COM组件,就能够使用它的方法获取Word文档中的文本信息,目前网上也有很多提供这种操作的工具。使用jacob前应确保本机安装有Word的应用程序,否则无法建立Java-COM桥,进而无法解析。
jacob的下载地址为http://sourceforge.net/project/showfiles.php?group_id=109543&package_id=118368
下载到本机后解压缩。将jacob.jar复制到项目目录,增加到Java Build Path,然后将jacob.dll文件放入系统盘的system32文件夹下。如果没有放的话,会出现"no jacob-1.14.3-x86 in java.library.path"的异常。
1
package test;
2
3
import com.jacob.activeX.ActiveXComponent;
4
import com.jacob.com.Dispatch;
5
import com.jacob.com.Variant;
6
7
public class WordReader {
8
9
public static void extractDoc(String inputFile, String outputFile){
10
boolean flag = false;
11
//打开word应用程序,生成一个ActivexComponent对象
12
ActiveXComponent app = new ActiveXComponent("Word.Application");
13
try{
14
//设置Word不可见
15
app.setProperty("Visible", new Variant(false));
16
//打开word文件
17
Dispatch doc1 = app.getProperty("Documents").toDispatch();
18
Dispatch doc2 = Dispatch.invoke(doc1, "Open", Dispatch.Method, new Object[]{ inputFile, new Variant(false),new Variant(true)},new int[1]).toDispatch();
19
//作文txt格式保存到临时文件
20
Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[]{outputFile, new Variant(7)}, new int[1]);
21
//关闭word
22
Variant f = new Variant(false);
23
Dispatch.call(doc2, "Close", f);
24
flag = true;
25
}catch(Exception e){
26
e.printStackTrace();
27
}finally{
28
app.invoke("Quit", new Variant[]{});
29
}
30
if(flag == true){
31
System.out.println("Transformed Successfully!");
32
}else{
33
System.out.println("Transform Failed");
34
}
35
36
}
37
38
/**
39
* @param args
40
*/
41
public static void main(String[] args) {
42
//对测试文本进行处理
43
WordReader.extractDoc("d:/index/网点地址.doc", "d:/index/网点地址.txt");
44
}
45
}

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

相关推荐
在使用JACOB调用Word宏之前,可以通过Visual Basic(VB)编写一个自动化的脚本来调用宏,并通过JACOB以Java代码实现相似的功能。具体来说,VB代码使用CreateObject创建Word应用程序实例,打开文档并调用宏。而Java...
3. **打印API**:Jacob通过调用Word的COM接口,可以访问到Word的打印API。这些API允许程序控制打印过程,包括选择打印机、设置打印选项、预览和实际打印。 4. **Word Automation**:在Java中使用Jacob进行Word自动...
在Jacob中,可以通过调用Word对象的相关方法来创建和操作表格,例如`Document.Tables.Add()`来插入新表格,`Table.Rows.Add()`添加行,`Table.Columns.Add()`添加列。设置字体则可以通过`Range`对象的`setBold()`, `...
Java使用Jacob库通过Word模板生成Word文档是一种常见的技术实践,特别是在需要自定义生成大量结构化报告的场景下。本项目实例提供了一个完整的解决方案,可以直接在MyEclipse环境中运行。下面将详细讲解这个项目的...
总的来说,通过Java和Jacob库的结合,我们可以实现批处理Word文档转换为txt,这对于大量文档处理的场景非常实用。但这种方法受限于Windows环境和Microsoft Office的安装,对于跨平台的应用可能不是最佳选择。在实际...
描述中强调了在Java中通过Jacob调用OCX组件时,错误处理的重要性。在使用Jacob桥接技术过程中可能会遇到各种错误,比如COM对象无法加载、方法调用失败、类型转换错误等,需要妥善处理这些异常情况,确保程序的稳定性...
本文主要探讨如何使用Java-JACOB来创建和操作Word文档。 首先,使用JACOB之前,确保你的系统中已经安装了Microsoft Office,并且配置了相应的COM组件。JACOB本身是一个开源项目,可以在SourceForge上找到...
这里提到的`jacob`库是Java和COM对象交互的一个库,它允许Java程序通过COM接口调用Windows上的Office应用程序,从而实现对Word文档的操作。下面我们将详细探讨如何使用Java和jacob库来处理Word文档。 首先,`...
Jacob(Java and COM Bridge)是一个 Java 库,它允许 Java 应用程序通过 COM(Component Object Model)接口与 Microsoft Office 进行交互。下面,我们将详细探讨如何使用 Jacob 实现 Word、Excel 和 PowerPoint ...
jacob调用自定义宏实现Java对Word的完美操作 jacob是一个Java-COM桥接器,允许Java程序与COM组件进行交互。在这个示例中,我们使用jacob来调用Word的自定义宏,实现Java对Word的完美操作。 标题: jacob调用自定义...
一旦你有了Word对象,你可以使用`Dispatch`类来调用Word的各种方法。例如,打开一个现有的Word文档: ```java Dispatch doc = Dispatch.get(word, "Documents").invoke("Open", new Variant[]{filePath})....
转换过程主要是通过Java调用Word的COM接口实现的。具体来说,就是通过JACOB创建一个指向Word应用程序的引用,然后通过该引用操作Word文档,最后保存为PDF格式。 #### 二、示例代码分析 下面是一段具体的Java代码...
Java使用Jacob库通过模板生成Word文档是一个常见的技术实践,尤其在企业级应用中,这种技术常用于批量生成报告、合同等文档。Jacob全称为Java Advanced COM Bridge,它为Java提供了与COM组件交互的能力,让我们可以...
"通过jacob实现word转为HTML"这个主题就是关于如何利用Java的一个库——Jacob来完成这项工作。Jacob是一个Java到COM桥接库,允许Java程序调用Windows COM组件,如Microsoft Office,从而实现对Office文档的操作。 ...
Jacob是Java语言的一个开源库,它提供了Java对COM组件的访问能力,从而让我们能够用Java调用MS Word的功能。 首先,要使用Jacob,你需要下载Jacob的库文件,通常是一个jar包(如`jacob-1.11.jar`)和对应的dll文件...
4. **设置转换选项**:你可以通过调用Word对象的属性和方法来设置转换参数,比如页面范围、质量、布局等,以确保PDF的格式与原Word文档一致。 5. **转换为PDF**:利用Word对象的`Execute`方法,执行打印或导出操作...
Jacob 是一个 Java 库,用于访问和操作 Microsoft Office 应用程序,包括 Word。它提供了一个基于 COM(Component Object Model)的接口,允许 Java 应用程序与 Word 进行交互操作。在本文中,我们将详细介绍如何...
总结起来,Java通过Jacob库和Microsoft Office的插件实现Word到PDF的转换是一种有效的方法,特别是当需要保持格式一致性时。然而,这种方法需要在运行环境中安装Office,并且可能受到Office版本限制。在实际开发中,...
5. **Java调用Word示例**:展示使用Jawin和Jacob进行实际操作Word文档的Java代码片段,例如添加文本、插入图片、格式化文档等。 6. **问题解决和最佳实践**:可能包含了开发者在使用这些库时可能遇到的问题及其解决...
### jacob调用Word代码详解 #### 一、前言 在进行自动化办公或文档处理时,经常会遇到需要与Microsoft Word交互的需求。JACOB(Java COM Bridge)库提供了一种简便的方式,允许Java程序通过COM接口来操作Office...