先贴代码,再解释与疑问(这段代码是我努力了半天的结果)
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.util.List;
import org.apache.poi.hssf.usermodel.HSSFClientAnchor;
import org.apache.poi.hssf.usermodel.HSSFPicture;
import org.apache.poi.hssf.usermodel.HSSFPictureData;
import org.apache.poi.hssf.usermodel.HSSFShape;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.PictureData;
import org.apache.poi.ss.usermodel.WorkbookFactory;
public class ReadPicturesFromExcel {
public static void main(String[] args) throws InvalidFormatException,
Exception {
InputStream inp = new FileInputStream(
"D:\\Users\\Fancy1_Fan\\桌面\\work\\test.xls");
HSSFWorkbook workbook = (HSSFWorkbook) WorkbookFactory.create(inp);
List<HSSFPictureData> pictures = workbook.getAllPictures();
HSSFSheet sheet = (HSSFSheet) workbook.getSheetAt(0);
int i = 0;
for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) {
HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();
if (shape instanceof HSSFPicture) {
HSSFPicture pic = (HSSFPicture) shape;
int row = anchor.getRow1();
System.out.println(i + "--->" + anchor.getRow1() + ":"
+ anchor.getCol1());
int pictureIndex = pic.getPictureIndex()-1;
HSSFPictureData picData = pictures.get(pictureIndex);
System.out.println(i + "--->" + pictureIndex);
savePic(row, picData);
}
i++;
}
}
private static void savePic(int i, PictureData pic) throws Exception {
String ext = pic.suggestFileExtension();
byte[] data = pic.getData();
if (ext.equals("jpeg")) {
FileOutputStream out = new FileOutputStream(
"D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".jpg");
out.write(data);
out.close();
}
if (ext.equals("png")) {
FileOutputStream out = new FileOutputStream(
"D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".png");
out.write(data);
out.close();
}
}
}
思路:
1.获得所有图片---->
2.得到sheet DrawingPatriarch的所有shape--->
3.获得shape的anchor --->
4.获得picture的pictureIndex(这个很关键)------->
5.最后假定pictureIndex就是allPictures中图片的位置,从而获得这张picture的data信息.
问题:
对于最后的假定没有官方文档的支持,所以有待测试.但是简单测试结果是ok的!
对于假定的证明:
官方文档向excel添加图片的流程是:
1.调用workbook的addPicture,并且返回此pictureIndex------>
2.然后创建一个ClientAnchor--------->
3.最后通过这个pictureIndex和Anchor把它绘到sheet上
由此可见pictureIndex,ClientAnchor以及pictureData是一一对应的关系,只要能够关联这三者,就可以获得
Excel中picture的完整信息了.
然而根据poi的api,只能单独获得picture,或者包含pictureIndex和anchor的HSSFPicture,并没有把它们关联在一起.
查看源码发现 HSSFWorkbook只不过是一个外观类,或者适配器类,low level工作类为InternalWorkbook
/**
* this is the reference to the low level Workbook object
*/
private InternalWorkbook workbook;
查看InternalWorkbook有api如下
public EscherBSERecord getBSERecord(int pictureIndex) {
return escherBSERecords.get(pictureIndex-1);
}
此处表明:如果能获得InternalWorkbook对象和pictureIndex,就可以获得图片数据和信息.但是没法通过 HSSFWorkbook对象获得InternalWorkbook对象,因为如下:(此方法为包访问)
InternalWorkbook getWorkbook() {
return workbook;
}
但是观察InternalWorkbook可以发现,如图:
private List<EscherBSERecord> escherBSERecords;
保存图像数据的底层是一个List有序的集合.以及根据getBSERecord方法,就推断出picutreIndex就是表示picture在List里面的下标.
以上仅仅是个人的见解,由于对于poi的整体设计理念并没有把握,所以对于以上问题暂时找不到没有一个合理的解释.
分享到:
相关推荐
在本文中,我们将深入探讨如何使用POI库向Excel工作簿中插入图片。这将涵盖相关的API,步骤以及一些实用技巧。 首先,我们需要理解Excel的内部结构。在Excel文件中,图片是以OLE对象的形式存储的。POI提供了...
本知识点主要讲解如何利用Apache POI库来获取Excel文件中某行的图片。 首先,我们要理解Apache POI的工作原理。POI是一个开源项目,它提供了API来读写Microsoft Office格式的文件,包括Excel。在处理Excel文件时,...
在Java编程环境中,Apache POI库是一个非常实用的工具,用于读取、写入和修改Microsoft Office格式的文件,特别是Excel(.xlsx 和 .xls)文件。本教程将详细介绍如何使用JAVA POI库来创建一个包含图片的完整Excel...
在这个"利用POI解析excel并存入数据库demo"中,我们将关注如何使用 POI 库来读取 Excel 文件,并将数据有效地存入 MySQL 数据库。 首先,要开始使用 POI,你需要在你的项目中引入相应的依赖。如果你使用的是 Maven...
Apache POI提供了API来处理这种二进制数据,开发者可以通过这些API来获取图片数据,并将其保存到本地或者进一步处理。 5. **项目构建**:从压缩包文件名`pom.xml`来看,这是一个使用Maven管理的Java项目。Maven是...
在IT行业中,Apache POI是一个广泛使用的库,主要用于读取和写入Microsoft Office格式的文件,尤其是Excel。本文将深入探讨如何使用POI库来实现Excel文件的导出,以及如何将图片URL转换为图片文件并与其他文件一起...
在Java环境中,如果你需要使用POI库来读取、写入或操作Excel文件,你需要确保你的项目中包含了正确的JAR文件。在这个场景中,你提到的几个JAR文件都是Apache POI的不同版本和组件: 1. **poi-3.8.jar**:这是Apache...
在这个场景中,我们将详细探讨如何使用Java POI读取Excel文件中的数据,包括获取总行数、列数、单元格内容、合并单元格、行高、列宽以及图片等信息。 首先,确保在项目中已经引入了Apache POI的依赖库。如果你使用...
在Java编程领域,Apache POI 是一个非常流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,包括Excel(XLS和XLSX)。本教程将深入探讨如何利用Apache POI来在Excel文件中完美地生成水印。水印通常...
在示例代码中,使用了Java POI读取Excel文件,并将其写入到数据库中。首先,需要创建一个Workbook对象,然后使用Workbook对象的getSheet方法获取Excel文件的Sheet对象,最后使用Sheet对象的getRow方法读取Excel文件...
在本文中,我们将深入探讨如何使用POI库将图片插入到Excel文档中,以便创建包含图像的丰富报告。 首先,让我们理解POI的基本概念。Apache POI提供了HSSF(Horrible Spreadsheet Format)和XSSF(XML Spreadsheet ...
平时工作中用到的一些技术点,拿出来和大家共享一下。 有些功能比较粗糙,如果大家有更加完善的示例或建议,欢迎交流。 1、jpg图片缩略图:ImageUtil ...2、poi创建excel:CDSHdlReport 3、计算表达式求值:Cal
然而,压缩包中的文件"svn.bmp"似乎与主题“POI读取Excel带格式数据”不直接相关,它可能是一个图片文件,用于补充说明或示例中的图表。由于无法查看具体内容,这里无法提供更详细的解释。 总的来说,Apache POI是...
在这个场景中,我们关注的是如何使用POI来创建一个功能丰富的Excel导出工具类,它能够自动设置标题、列名、文件名,并且支持插入图片以及合并单元格。下面将详细介绍这些功能的实现。 首先,要创建一个Excel工作簿...
本篇文章将详细讲解如何使用Java POI库获取Excel文件(包括WPS创建的文件)中的图片,以及如何处理单元格内嵌图片。 首先,让我们了解POI中处理图片的基本概念。POI中的`XSSFWorkbook`和`HSSFWorkbook`类提供了`...
标题提到的"poi读取excel所需jar包"主要涉及以下组件: 1. **poi-3.8-20120326.jar**:这是Apache POI的主要库,包含了处理Excel(HSSF和XSSF)以及其他Office文档的核心功能。版本3.8是一个较早的版本,但仍然能够...
在Java编程领域,Apache POI是一个非常流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,特别是Excel工作簿(.xls或.xlsx)。在这个“POI导出Excel表格”的实例中,我们将深入探讨如何利用Apache...
本篇将深入探讨如何使用Apache POI库来替换Word文档中的图片,无论文档是.doc还是.docx格式。 首先,我们需要理解Apache POI的工作原理。POI提供了一个高级API,允许开发者读取、创建和修改Office文档。对于Word...
这个“poi读取excel所需jar(完整版)”压缩包应该包含了所有处理Excel所需的POI库文件,确保你可以顺利地在Java项目中进行Excel操作。记得根据你的项目需求选择合适的版本,保持库的更新,以利用最新的特性与修复。
由于提供的文件名称“BEI~{CL`@E0D~X6F~@584P.jpg”看起来像是一个图片文件,可能与正文内容无关,因此在讨论POI解析Excel的知识点时,我们无法直接引用这个文件。不过,通常在实际项目中,开发者可能会结合Excel...