上一个项目的开发中需要实现从word中读取表格数据的功能,在JAVA社区搜索了很多资料,终于找到了两个相对最佳的方案,因为也得到了不少网友们的帮助,所以不敢独自享用,在此做一个分享。
两个方案分别是:一,用POI的TableIterator获取表格中的数据;二,用PageOffice来获取。
为什么说是两个相对最佳的方案呢?因为两个方案都各有优缺点,POI的优点很明显,就是免费,这正是PageOffice的缺点,PageOffice是一个国产的商业Office组件;POI的缺点有点多,接口复杂调用起来比较麻烦,尤其是不好读取word指定位置处的内容。由于获取表格数据的代码是在服务器端执行的,所以要求很高的代码质量,要考虑到代码执行效率问题、用户请求并发问题、大文档执行慢阻塞页面的问题等等,POI的架构属于仿VBA接口的模型,比VBA代码还要复杂,在调用方便上未做任何优化,光看代码都觉得头疼。所以在实际使用的过程中会遇到这些问题需要自己解决,相对来说这正是PageOffice的优点,使用PageOffice的话,就不会遇到这些问题,因为PageOffice的获取word中表格数据的工作是在客户端执行的,确实也符合了分布式计算思想,减轻服务器端压力,还有个强悍的功能,PageOffice可以从word表格中用很简单一句代码把图片提取出来!!!
PageOffice虽是收费的,但是事半功倍,而且还能实现许多POI无法实现的功能。如果确实预算紧张,还是需要用POI,再难用也要捏着鼻子用了……,闲话少撤,看代码实现。
PageOffice获取word表格中数据的核心代码:
WordDocument doc = new WordDocument(request,response);
DataRegion dataReg = doc.openDataRegion("PO_table");
Table table = dataReg.openTable(1);
String cellValue = table.openCellRC(1,2).getValue(); //获取书签“PO_table”中表格里第1行第2列单元格的值
doc.close();
以上代码是从例子代码里拷贝出来的,可以从PageOffice的官网下载中心下载“PageOffice for JAVA ”,把PageOffice开发包里的Samples4运行起来,看示例(二、16、获取Word文件中表格的数据)里面的具体代码和实现效果。
需要说明一点,PageOffice中提到了一个数据区域(DataRegion)的概念,其实所谓的数据区域本质上就是书签,但是这个书签必须以“PO_” 开头。把表格放到数据区域中貌似不方便,但是好处很大,如果word文件中有多个表格的话,可以用数据区域去指定PageOffice获取word中哪个表格的数据,定位非常方便,比方说PO_Table的书签里有一个表格,那么不管这个表格在整个word文件中是第几个表(word中的表格没有名称只有Index,从文件头到末尾依次编号的)用doc.openDataRegion("PO_table").openTable(1);总是可以获取到这个表格的数据,非常方便,用POI就不行了,表格、图片位置移动,代码必须重写。
就写这么多吧,做个共享,希望对大家都有帮助。
分享到:
相关推荐
在上述代码中,`getGoodsList()`方法返回的商品列表对应于模板中的表格数据,列表的每个元素都应该与表格中的行一一对应,这样在生成文档时,数据就会自动填充到对应的表格中。 通过这种方式,你可以轻松地创建包含...
标题“jacob读取word表格”涉及到的是使用Jacob库来操作Microsoft Word文档,特别是从中读取表格数据。Jacob是一个Java到COM桥接库,允许Java应用程序调用COM组件,如Microsoft Office的应用程序。 在Java中,直接...
### Java读取DOC/DOCX/Word文档内容的数据方法 #### 概述 在实际开发过程中,经常需要处理各种格式的文档数据。其中,Word文档(.doc 和 .docx)是最常见的一种类型。Java提供了多种库来读取这些文档中的内容,...
// 处理图片,需要获取图片URL并保存到本地,然后添加到Word中 String imageUrl = element.attr("src"); byte[] imageBytes = downloadImage(imageUrl); // 自定义下载图片方法 XWPFPictureData pictureData = ...
在Java中,如果你需要在Word文档中插入图片,POI库提供了解决方案。这个过程涉及到对Word文档的内部结构有深入的理解,包括其XML表示形式,以及如何通过API来操作这些元素。 首先,我们需要导入必要的库,包括POI的...
"Java通过word模板配置书签生成word"是一个技术方案,它利用了Java的API来处理Microsoft Word文档,特别是Apache POI库,这是一种强大的工具,允许开发者在Java程序中创建、修改和展示MS Office格式的文件。...
本项目"java批量获取excel数据导入word文档中.zip"旨在解决一个特定的问题:自动化地从Excel文件中提取数据,并将这些数据整合到Word文档中。这种功能对于需要大量文书工作的专业人士,如律师,或者其他需要重复性...
在Java开发中,生成Word文档是一项常见的需求,例如在报告生成、数据导出等场景。RtfTemplate是一个方便的工具库,它可以帮助开发者快速、高效地生成Word文档,特别是基于RTF(Rich Text Format)格式的文件。这个库...
在Java编程环境中,将文档(如Excel、Word、PDF、PPT)转换为图片是一种常见的需求,这在处理大量文档预览、数据可视化或者移动设备兼容性问题时尤其有用。以下是一些关于如何使用Java实现这种转换的关键知识点: 1...
Java读取Word文档通常涉及到对Microsoft Office接口的模拟,这在Java中通常是通过第三方库来实现的。这里提到的“java读word系统调用工具”指的是利用Java COM(Component Object Model)桥梁技术来与Windows系统中...
这个“JAVA生成WORD工具类”提供了一种解决方案,使得开发者可以通过代码动态地生成Word文档,避免手动操作的繁琐和错误。下面将详细介绍这个工具类的工作原理和可能的应用场景。 首先,Java生成Word文档通常涉及到...
总的来说,"JAVA将PDF文件转WORD所需jar包.rar" 提供了实现PDF转Word功能所必需的库文件,开发者可以利用这些工具进行二次开发,构建自己的转换解决方案。需要注意的是,转换的质量可能受到PDF本身的复杂性影响,...
在Java应用中,JODConverter可以作为便捷的文档转换解决方案。 在实际开发中,使用Java2Word可能涉及以下步骤: 1. **环境配置**:安装Apache POI库,或者安装OpenOffice或LibreOffice并配置相关服务。 2. **创建...
在日常工作中,有时我们需要通过程序自动生成Word文档,尤其是在报表生成、数据导出等场景下。利用Java来生成Word文档不仅可以提高工作效率,还能确保文档的一致性和准确性。本文将详细介绍如何使用Java结合Jacob库...
在这个场景中,我们看到一个关于如何使用Java编程语言实现此功能的资源包:“利用poi+itextpdf进行word转pdf.rar”。这个压缩包包含源码、依赖库以及转换效果的示例,表明它提供了一种无需额外插件的解决方案。下面...
在日常工作中,我们经常需要将数据导出到Word文档中,以便于打印或进一步编辑。然而,在使用Java进行开发时,如何高效地生成带有复杂样式的Word文档一直是开发者面临的一大挑战。传统的解决方案如Apache POI虽然在...
JavaWord文档导出jar包与Freemarker是一个用于在Java后端生成动态Word文档的解决方案。这个rar压缩包中包含的jar文件可以帮助开发者利用Freemarker模板语言将数据动态地填充到Word文档中,实现自动化文档生成。下面...
Java POI 操作 Word 是一个高效且广泛使用的技术,它允许开发者在 Java 应用程序中创建、修改和读取 Microsoft Word 文档。相对于其他如 Jacob 的解决方案,POI 提供了更高的性能,并且它的API更为简洁易用。在本文...
总之,"word、ppt、excel转pdf读取页数Demo"涵盖了文件格式转换和PDF元数据读取的核心技术,这些技术在文档管理和协同工作中有着广泛的应用。理解并掌握这些知识点对于开发高效、可靠的文档处理工具至关重要。