`
aspoems
  • 浏览: 26609 次
  • 性别: Icon_minigender_1
  • 来自: 南京
社区版块
存档分类
最新评论

jacob 读取word 各级标题和标题对应代码

阅读更多
     从网上下载Jacob开发包,并进行配置,将jar包在eclipse配置好后,并将jacob.dll放到c:/windows/system32即可,以下是代码:
import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

public class TestDocPage {
	
	
	 public static void main (String [] args) throws Exception {
		 
		   String filePath = "E:\\test.doc";
		   
		   ActiveXComponent word=new ActiveXComponent("Word.Application");
		   
		   word.setProperty("Visible", new Variant(false)); 
		   
		   Dispatch documents=word.getProperty("Documents").toDispatch();
		   
		   Dispatch wordFile=Dispatch.invoke(documents, "Open", Dispatch.Method, new Object[]{filePath,new Variant(true),new Variant(false)}, new int[1]).toDispatch();	
	
		   Dispatch paragraphs=Dispatch.get(wordFile, "Paragraphs").toDispatch();
           
           int paraCount=Dispatch.get(paragraphs, "Count").getInt();
           
          for(int i=0;i<paraCount;++i){
	
	           Dispatch paragraph=Dispatch.call(paragraphs, "Item",new Variant(i+1)).toDispatch();
	           
	           int outline=Dispatch.get(paragraph, "OutlineLevel").getInt();
	           
	           if(outline<=9){
	        	   
		           System.out.println("大纲等级:"+outline);
		           System.out.println("\n");
		           Dispatch paraRange=Dispatch.get(paragraph, "Range").toDispatch();
		
		           System.out.println("标题名称:"+Dispatch.get(paraRange, "Text").toString());
		
		           int pages = Integer.parseInt(Dispatch.call(paraRange,"information",1).toString());
		           
		           System.out.println("标题页码:"+pages);
		           System.out.println("\n");
	      
	           }
          
           }
         
		   Dispatch.call(wordFile, "Close", new Variant(true));
		   Dispatch.call(word, "Quit");
	   }
	   
}

这里的标题获取是根据word的大纲标题等级来获取的,代码经测试通过。
分享到:
评论

相关推荐

    jacob读取word表格

    标题“jacob读取word表格”涉及到的是使用Jacob库来操作Microsoft Word文档,特别是从中读取表格数据。Jacob是一个Java到COM桥接库,允许Java应用程序调用COM组件,如Microsoft Office的应用程序。 在Java中,直接...

    jacob以目录和段落分析读取Word文档(自己写的)

    总结来说,这个项目展示了如何使用Jacob库来读取Word文档,尤其是通过目录定位标题和获取它们之间的段落内容。虽然在这个实现中,表格和图片未被处理,但Jacob提供了必要的接口来处理这些复杂元素,使得我们可以构建...

    jacob 操作word 文档详解

    Jacob 是一个 Java 库,用于访问和操作 Microsoft Office 应用程序,包括 Word。它提供了一个基于 COM(Component Object Model)的接口,允许 Java 应用程序与 Word 进行交互操作。在本文中,我们将详细介绍如何...

    java之jacob实现获取word文件的内容

    读取word文件的内容,并将内容返回为String类型!

    jacob生成word目录

    1. **初始化JACOB**: 在Java代码中,我们需要导入JACOB相关的库,并初始化一个`ActiveXComponent`对象,代表Word应用程序实例。 ```java import com.jacob.activeX.ActiveXComponent; import ...

    JACOB操作word和excel示例

    这意味着你可以直接在Java代码中创建、编辑、读取和转换Word文档以及Excel电子表格。 **如何使用Jacob将Word转换为PDF** 在“如何使用jacob将word转换为PDF.doc”这个示例中,我们将学习如何使用Jacob将Word文档...

    Java读取Word文档页数

    本主题将深入探讨如何利用给定的`itextpdf-5.5.9.jar`和`jacob.jar`这两个库来实现Java读取Word文档页数的功能。 `jacob.jar`是一个Java到COM桥接库,它允许Java应用程序调用Microsoft Office组件,如Word,从而...

    jacob 操作word完整代码实例,绝对实用

    这个“Jacob操作Word完整代码实例”是学习和实践这一技术的好材料,它涵盖了从打开文档、编辑内容到保存和关闭文档的一系列操作。在实际开发中,这样的功能可以应用于批量处理文档、自动化报告生成等多种场景。

    Jacob操作word 文档的方法集!(含创建目录),使用的Jacob版本是1.5

    Jacob是一个Java库,它提供了一个接口来调用Microsoft Office应用程序,如Word,Excel和PowerPoint。这个库使得在Java程序中处理Office文档成为可能,无需使用COM(Component Object Model)编程。在这个“Jacob操作...

    通过jacob实现word转为HTML

    总结来说,"通过jacob实现word转为HTML"是一种利用Java和Windows COM接口来实现文档转换的技术。尽管存在一定的局限性,但对于简单的转换需求,尤其是需要在Java项目中集成Office功能时,Jacob提供了一个有效且直接...

    jacob操作word文件

    在给定的代码片段中,`GetWord` 类提供了使用Jacob操作Word文档的一些基本功能。 首先,`GetWord` 类初始化了一个`ActiveXComponent` 对象 `word`,这是Jacob库中的一个关键类,用于实例化COM对象,这里是Microsoft...

    使用jacob将word转换为html的完整代码

    因此,要在运行此代码的机器上安装有Word,并且确保兼容性与你的Java版本和操作系统相匹配。 在MyEclipse环境下,你可能需要对项目配置进行一些调整,比如设置JDK版本、确保库的路径正确等,以确保代码能正常编译和...

    jacob操作word(超详细)

    1、把jacob.dll文件,复制到 windows\system32 目录下。(注:我用的时候这个方法不能运行) 2、 把jacob.dll放入 Java\jdk1.5.0_06\jre\bin目录下.把jacob.jar放入 Java\jdk1.5.0_0\jre\lib\ext 目录下.可以正常...

    jacob操作word转换成pdf

    当你下载并包含JACOB库(如压缩包中的`jacob_1.9`)到项目中后,你需要确保`jacob.jar`和对应的DLL文件被正确地配置。 在进行Word到PDF的转换之前,确保你已经在JDK的`bin`目录下放置了JACOB所需的DLL文件,通常是`...

    java准确读取word页码

    在Java编程环境中,读取Word文档的页码是一项常见的任务,尤其在处理大量文档数据时。这个场景下,我们通常会使用Apache POI库,这是一个强大的API,专门用于处理Microsoft Office格式的文件,包括Word(.doc和.docx...

    利用jacob实现替换word文本和图片

    利用jacob实现替换word文本和图片,需要导入响应jar包和dll.

Global site tag (gtag.js) - Google Analytics