`
妮子321
  • 浏览: 84492 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

java获取word文档的条目化内容

阅读更多

在开发Web办公系统或文档系统时,PageOffice组件是众所周知的在线处理微软word/ppt/excel文档的强大工具,它对WORD文档的各种处理在API层面进行了封装,屏蔽了Office VBA接口的复杂性,而又不失VBA的强大功能,在此要分享的正是PageOffice封装的一个很强大的功能:获取word文档的条目化内容。在一个包含了文档处理功能的办公系统里,用户出于各种原因,希望能通过程序自动分析word文档中每个章节的内容也是一种合理的需求,而PageOffice为实现此功能提供的接口也非常简单,废话少说,直接看代码:

  PageOffice具体的集成过程在此略过。。。(详细看PageOffice for java 开发包中的安装说明)

  1. 调用PageOffice在线打开一个包含了章节层次的word文档,比如:test.doc

PageOfficeCtrl poCtrl=new PageOfficeCtrl(request);
poCtrl.setServerPage(request.getContextPath()+"/poserver.zz");
//打开Word文档
poCtrl.webOpen("doc/test.doc",OpenModeType.docNormalEdit,"张佚名");

  2. 在打开word文件的页面(比如:word.jsp)里显示文件的区域添加PageOffice的代码:

    <div style=" width:1000px; height:650px;">
        <%=poCtrl.getHtmlCode("PageOfficeCtrl1")%>
    </div>

  3. 文件在线打开之后,通过按钮或其他方式调用执行下面的js,变量txt就可以获取到文档条目化的内容:

  var txt = document.getElementById("PageOfficeCtrl1").GetWordItemsConent();

  4. 运行效果:

  

  源码下载: https://download.csdn.net/download/zi_wu_xian/10404732

分享到:
评论

相关推荐

    Java如何获取word文档的条目化内容

    Java获取Word文档的条目化内容 Java获取Word文档的条目化内容是Web办公系统或文档系统中一个非常重要的功能,PageOffice组件提供了强大的工具来实现这个功能。在本文中,我们将详细介绍如何使用PageOffice获取Word...

    Java 添加Word项目符号、编号列表.zip

    Spire.Doc for Java是一个强大的Java库,它提供了丰富的API接口,使得开发者可以方便地创建、编辑、格式化和转换Microsoft Word文档。对于添加项目符号和编号列表,这个库提供了简单易用的方法。 首先,我们需要...

    java--Poi 生成word文档

    Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括Word文档。在这个“java--Poi 生成word文档”的示例中,我们将深入探讨如何利用POI库来生成Word文档。Apache POI提供...

    java_word填充数据导出工具

    接下来,使用POI API创建一个Word文档对象,并读取模板文件。例如,你可以创建一个`XWPFDocument`实例来加载`.docx`文件: ```java FileInputStream fis = new FileInputStream("template.docx"); XWPFDocument ...

    itext操作word生成目录、页码、表格、插入图片

    尽管它的主要用途在于PDF,但通过一些转换工具,也可以用来操作Word文档。本篇将深入探讨如何使用iText来实现Word文档中的目录生成、页码设置、表格创建以及图片插入等功能。 首先,我们需要理解的是,由于iText...

    office中的域

    比如“\cite”域用于插入引用,“\TOC”域则用于生成目录,这些域会根据文档内容自动更新引用和目录条目。 5. **邮件合并**:在进行批量信件或标签的打印时,邮件合并功能使用域将数据从数据源(如Excel表格)引入...

    用java从doc和docx格式的word文档中提取图片.doc

    在Java编程环境中,提取DOC和DOCX格式的Word文档中的图片是一项常见的任务,尤其是在处理大量文档时。这两种格式由于其内部存储方式不同,提取图片的方法也有所不同。 对于**DOCX**格式的文档,正如描述中指出的,...

    一简单的方法jsp生成导出word

    在IT行业中,尤其是在Web开发领域,常常...然而,需要注意的是,由于Word文档格式的复杂性,这种方式可能无法实现所有高级功能,对于复杂的布局和格式化,可能需要使用其他工具或服务,如Microsoft Word的自动化接口。

    android应用源码tree目录和读取word文档整合源码.zip

    在Android开发中,有时我们需要处理复杂的文件系统操作,如展示文件树目录以及读取特定格式的文档,例如Word文档。这个“android应用源码tree目录和读取word文档整合源码.zip”压缩包就提供了这样的功能实现。接下来...

    Java解析pdf,zip,doc等格式文档

    POI提供了HPSF(Hierarchical Property Set Facility)用于处理文档属性,HWPF(Horrible Word Processor Format)用于处理文档内容。你可以通过HWPFDocument类加载DOC文件,然后访问其段落、表格、图片等元素。 ...

    POI-将数据导出到Word的实例

    通过以上分析,我们可以看到使用 POI 将数据导出到 Word 文件的基本流程,包括文件系统的创建、文档条目的写入等关键步骤。此外,还讨论了一些常见的扩展应用场景和技术点。在实际开发中,根据具体需求灵活运用这些...

    JSP.rar_jsp_word

    在“JSP.rar”中的“JSP.docx”文件可能是一个预生成的Word文档示例,用于展示期望的结果。而“www.pudn.com.txt”可能是文档来源的链接或者说明文本,提供了一些额外的信息或参考资料。 需要注意的是,生成Word...

    apache poi 导出excel、word

    要在Word文档中替换特定内容,需要找到对应的Run对象,然后修改其text属性。如果内容是通过Field对象插入的,可能需要更新Field的值。POI还提供了查找和替换文本的功能,这在批量处理或模板化文档时非常有用。 5. ...

    Nouveau Microsoft Word Document_noma_sic_nomaSIC_Nomasic_noma_源码

    5. **文本处理和格式化**: 源码可能包含处理文本内容、样式、段落格式、页眉页脚等Word文档元素的代码。 6. **自动化和宏**: 如果源码涉及的是工具或脚本,那么可能涉及到Word的自动化功能,如宏的编写。 7. **...

    java生成柱状图、拆线图

    在Java中生成柱状图和折线图是一项常见的需求,比如用于数据可视化或者报告展示。这篇博客文章(链接未提供)可能介绍了如何利用JFreeChart库来实现这一功能。 JFreeChart是一个强大的Java图形库,它提供了丰富的...

    java-grok依赖jar包

    Java-Grok是一个强大的日志解析库,主要用于从结构化不明显的日志文本中提取出有结构的数据。在Java世界中,Grok模式是基于Perl Compatible Regular Expressions (PCRE)的,它允许开发者通过预定义或者自定义的模式...

    软件开发文档模板(最全)

    软件开发文档大全通常包含以上这些核心文件,它们是团队协作的基础,保证了项目的高效、有序进行。对于初学者和经验丰富的开发者来说,拥有一个全面的文档模板集合是非常宝贵的资源,可以快速适应项目规范,提高工作...

    倒排索引java实现

    如果未找到,则在词典中创建新条目,并添加当前文档编号。 4. **处理位置信息**:为了支持更复杂的搜索需求,如短语查询,我们还需要记录每个词汇在文档中的位置。可以在倒排列表中添加位置信息,例如以元组(文档...

    jacob-1.18.zip

    2. **打开Word文档**: 使用`Dispatch`接口打开Word文件,可以指定文件路径。 3. **执行转换**: 使用Word的COM接口,调用`SaveAs`方法,将文档保存为PDF格式。这里需要设置适当的文件路径和保存类型。 4. **关闭Word*...

Global site tag (gtag.js) - Google Analytics