`
18335864773
  • 浏览: 22271 次
文章分类
社区版块
存档分类
最新评论

[转载]java获取word文档的条目化内容

阅读更多

在开发Web办公系统或文档系统时,PageOffice组件是众所周知的在线处理微软word/ppt/excel文档的强大工具,它对WORD文档的各种处理在API层面进行了封装,屏蔽了Office VBA接口的复杂性,而又不失VBA的强大功能,在此要分享的正是PageOffice封装的一个很强大的功能:获取word文档的条目化内容。在一个包含了文档处理功能的办公系统里,用户出于各种原因,希望能通过程序自动分析word文档中每个章节的内容也是一种合理的需求,而PageOffice为实现此功能提供的接口也非常简单,废话少说,直接看代码:

  PageOffice具体的集成过程在此略过。。。(详细看PageOffice for java 开发包中的安装说明)

  1. 调用PageOffice在线打开一个包含了章节层次的word文档,比如:test.doc

PageOfficeCtrl poCtrl=new PageOfficeCtrl(request);
poCtrl.setServerPage(request.getContextPath()+"/poserver.zz");
//打开Word文档
poCtrl.webOpen("doc/test.doc",OpenModeType.docNormalEdit,"张佚名");

  2. 在打开word文件的页面(比如:word.jsp)里显示文件的区域添加PageOffice的代码:

    <div style=" width:1000px; height:650px;">
        <%=poCtrl.getHtmlCode("PageOfficeCtrl1")%>
    </div>

  3. 文件在线打开之后,通过按钮或其他方式调用执行下面的js,变量txt就可以获取到文档条目化的内容:

  var txt = document.getElementById("PageOfficeCtrl1").GetWordItemsConent();

  4. 运行效果:

  

  源码下载: https://download.csdn.net/download/zi_wu_xian/10404732

 

分享到:
评论

相关推荐

    java获取word文档的条目化内容

    java调用PageOffice在线编辑word文件的时候,获取word文档的条目化内容。 PageOffice V4.0 企业版试用序列号:Q37LN-W8NI-KFSQ-LEY3Y 部署步骤: 1. 拷贝simpledemo8文件夹到Tomcat的webapps目录下 2. 访问...

    Java如何获取word文档的条目化内容

    Java获取Word文档的条目化内容 Java获取Word文档的条目化内容是Web办公系统或文档系统中一个非常重要的功能,PageOffice组件提供了强大的工具来实现这个功能。在本文中,我们将详细介绍如何使用PageOffice获取Word...

    Java 添加Word项目符号、编号列表.zip

    Spire.Doc for Java是一个强大的Java库,它提供了丰富的API接口,使得开发者可以方便地创建、编辑、格式化和转换Microsoft Word文档。对于添加项目符号和编号列表,这个库提供了简单易用的方法。 首先,我们需要...

    java--Poi 生成word文档

    Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word文档。在这个“java--Poi 生成word文档”的示例中,我们将深入探讨如何利用POI库来生成Word文档。Apache POI提供...

    java_word填充数据导出工具

    这些依赖包含了处理XML格式的Word文档(.docx)所需的所有类和方法。 接下来,使用POI API创建一个Word文档对象,并读取模板文件。例如,你可以创建一个`XWPFDocument`实例来加载`.docx`文件: ```java ...

    itext操作word生成目录、页码、表格、插入图片

    尽管它的主要用途在于PDF,但通过一些转换工具,也可以用来操作Word文档。本篇将深入探讨如何使用iText来实现Word文档中的目录生成、页码设置、表格创建以及图片插入等功能。 首先,我们需要理解的是,由于iText...

    用java从doc和docx格式的word文档中提取图片.doc

    在Java编程环境中,提取DOC和DOCX格式的Word文档中的图片是一项常见的任务,尤其是在处理大量文档时。这两种格式由于其内部存储方式不同,提取图片的方法也有所不同。 对于**DOCX**格式的文档,正如描述中指出的,...

    office中的域

    比如“\cite”域用于插入引用,“\TOC”域则用于生成目录,这些域会根据文档内容自动更新引用和目录条目。 5. **邮件合并**:在进行批量信件或标签的打印时,邮件合并功能使用域将数据从数据源(如Excel表格)引入...

    android应用源码tree目录和读取word文档整合源码.zip

    在源码中,可能使用了`XWPFDocument`类来加载Word文档,并通过`getParagraphs()`或`getTables()`等方法获取文档元素。为了在Android环境中使用这些Java库,通常需要将它们转换为AAR格式并添加到项目依赖中。 3. ...

    一简单的方法jsp生成导出word

    在IT行业中,尤其是在Web开发领域,常常...然而,需要注意的是,由于Word文档格式的复杂性,这种方式可能无法实现所有高级功能,对于复杂的布局和格式化,可能需要使用其他工具或服务,如Microsoft Word的自动化接口。

    Java解析pdf,zip,doc等格式文档

    POI提供了HPSF(Hierarchical Property Set Facility)用于处理文档属性,HWPF(Horrible Word Processor Format)用于处理文档内容。你可以通过HWPFDocument类加载DOC文件,然后访问其段落、表格、图片等元素。 ...

    软件开发文档模板(最全)

    本文将深入探讨“软件开发文档模板(最全)”所涵盖的几个核心部分:需求文档、设计文档和开发文档,以及它们如何在软件生命周期中发挥作用。 1. **需求文档**: - 需求分析报告:详细描述软件应实现的功能和非...

    POI-将数据导出到Word的实例

    通过以上分析,我们可以看到使用 POI 将数据导出到 Word 文件的基本流程,包括文件系统的创建、文档条目的写入等关键步骤。此外,还讨论了一些常见的扩展应用场景和技术点。在实际开发中,根据具体需求灵活运用这些...

    JSP.rar_jsp_word

    3. **写入内容**:使用Document对象提供的方法,如createParagraph()和createCharacterRun(),可以向Word文档中添加文本、段落、表格等元素。 4. **设置样式**:POI允许你设置字体、颜色、对齐方式等样式属性,以...

    apache poi 导出excel、word

    要在Word文档中替换特定内容,需要找到对应的Run对象,然后修改其text属性。如果内容是通过Field对象插入的,可能需要更新Field的值。POI还提供了查找和替换文本的功能,这在批量处理或模板化文档时非常有用。 5. ...

    Nouveau Microsoft Word Document_noma_sic_nomaSIC_Nomasic_noma_源码

    5. **文本处理和格式化**: 源码可能包含处理文本内容、样式、段落格式、页眉页脚等Word文档元素的代码。 6. **自动化和宏**: 如果源码涉及的是工具或脚本,那么可能涉及到Word的自动化功能,如宏的编写。 7. **...

    XML_在线相册word文档

    XML(eXtensible Markup Language)是一种用于标记数据的语言,其...这样的系统设计实现了数据的结构化存储,提供了灵活的数据交换,并且可以通过JSP进行动态交互,为用户提供了一个功能齐全、界面友好的在线相册平台。

    倒排索引java实现

    如果未找到,则在词典中创建新条目,并添加当前文档编号。 4. **处理位置信息**:为了支持更复杂的搜索需求,如短语查询,我们还需要记录每个词汇在文档中的位置。可以在倒排列表中添加位置信息,例如以元组(文档...

    java复习2013

    文件名“java.doc”可能是一个包含Java教程或笔记的Microsoft Word文档,其中可能详细介绍了Java的基础知识,如数据类型、控制流(if-else、switch、循环)、方法、数组、类与对象,以及高级主题,如集合框架(List...

    jacob-1.18.zip

    在Java应用中,通过Jacob库可以调用Microsoft Office的COM接口,实现对Word文档的操作,如读取、修改,并将其转换为PDF格式。这通常涉及到对Office应用程序(如Word)的自动化操作,而无需用户界面的参与。 在标签...

Global site tag (gtag.js) - Google Analytics