`
fansfirst2008
  • 浏览: 98666 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

poi 获取excel中图片

阅读更多

先贴代码,再解释与疑问(这段代码是我努力了半天的结果)

 

 

import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.util.List;

import org.apache.poi.hssf.usermodel.HSSFClientAnchor;
import org.apache.poi.hssf.usermodel.HSSFPicture;
import org.apache.poi.hssf.usermodel.HSSFPictureData;
import org.apache.poi.hssf.usermodel.HSSFShape;
import org.apache.poi.hssf.usermodel.HSSFSheet;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.ss.usermodel.PictureData;
import org.apache.poi.ss.usermodel.WorkbookFactory;

public class ReadPicturesFromExcel {

    public static void main(String[] args) throws InvalidFormatException,
            Exception {

        InputStream inp = new FileInputStream(
                "D:\\Users\\Fancy1_Fan\\桌面\\work\\test.xls");
        HSSFWorkbook workbook = (HSSFWorkbook) WorkbookFactory.create(inp);

        List<HSSFPictureData> pictures = workbook.getAllPictures();
        HSSFSheet sheet = (HSSFSheet) workbook.getSheetAt(0);
        
        
        int i = 0;
        for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) {
            HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();

            if (shape instanceof HSSFPicture) {
                HSSFPicture pic = (HSSFPicture) shape;
                int row = anchor.getRow1();
                System.out.println(i + "--->" + anchor.getRow1() + ":"
                        + anchor.getCol1());
                int pictureIndex = pic.getPictureIndex()-1;
                HSSFPictureData picData = pictures.get(pictureIndex);

                System.out.println(i + "--->" + pictureIndex);
                savePic(row, picData);
            }
            i++;
        }
    }

    private static void savePic(int i, PictureData pic) throws Exception {

        String ext = pic.suggestFileExtension();

        byte[] data = pic.getData();
        if (ext.equals("jpeg")) {
            FileOutputStream out = new FileOutputStream(
                    "D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".jpg");
            out.write(data);
            out.close();
        }
        if (ext.equals("png")) {
            FileOutputStream out = new FileOutputStream(
                    "D:\\Users\\Fancy1_Fan\\桌面\\work\\pict" + i + ".png");
            out.write(data);
            out.close();
        }
    }

}

 

  思路:

        1.获得所有图片---->

        2.得到sheet DrawingPatriarch的所有shape--->

        3.获得shape的anchor --->

        4.获得picture的pictureIndex(这个很关键)------->

        5.最后假定pictureIndex就是allPictures中图片的位置,从而获得这张picture的data信息.

  问题:

         对于最后的假定没有官方文档的支持,所以有待测试.但是简单测试结果是ok的!

 

  对于假定的证明:

         官方文档向excel添加图片的流程是:

         1.调用workbook的addPicture,并且返回此pictureIndex------>

         2.然后创建一个ClientAnchor--------->

         3.最后通过这个pictureIndex和Anchor把它绘到sheet上

    由此可见pictureIndex,ClientAnchor以及pictureData是一一对应的关系,只要能够关联这三者,就可以获得

    Excel中picture的完整信息了.

    然而根据poi的api,只能单独获得picture,或者包含pictureIndex和anchor的HSSFPicture,并没有把它们关联在一起.

 

 

    查看源码发现 HSSFWorkbook只不过是一个外观类,或者适配器类,low level工作类为InternalWorkbook

 

  /**
     * this is the reference to the low level Workbook object
     */

    private InternalWorkbook workbook;
 

    查看InternalWorkbook有api如下

 

  public EscherBSERecord getBSERecord(int pictureIndex) {
        return escherBSERecords.get(pictureIndex-1);
    }

  此处表明:如果能获得InternalWorkbook对象和pictureIndex,就可以获得图片数据和信息.但是没法通过 HSSFWorkbook对象获得InternalWorkbook对象,因为如下:(此方法为包访问)

 

  InternalWorkbook getWorkbook() {
        return workbook;
    }

 

  但是观察InternalWorkbook可以发现,如图:

 

private List<EscherBSERecord> escherBSERecords;

 保存图像数据的底层是一个List有序的集合.以及根据getBSERecord方法,就推断出picutreIndex就是表示picture在List里面的下标.

 

 

以上仅仅是个人的见解,由于对于poi的整体设计理念并没有把握,所以对于以上问题暂时找不到没有一个合理的解释.

 

 

分享到:
评论
7 楼 zhang1212 2017-08-29  
alex.Lin 写道
for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) 取不到外部插入的图片

我也遇到了,请问解决了吗?我换了3.1,3.6,3.7的jar包都不行
6 楼 u010100704 2014-09-03  
import org.apache.poi.ss.usermodel.WorkbookFactory; 那个WorkbookFactory是哪里的,我的POI3.9版本,报错啊
5 楼 kyh8408 2012-08-06  
有谁知道如何读取excel 2007 中图片及图片所在的行数
4 楼 xufan 2012-05-10  
2楼问题怎么解决的啊 》??  能讲下吗? 谢。。。。。。。
3 楼 xufan 2012-05-10  
2楼问题怎么解决的啊?
2 楼 lanchedashi 2012-03-26  
你好, 这文章非常受用, 不知道有没有关于excel 2007版的相关处理, 我用你的方法找了下源码, 发现XSSF 的没有返回XSSFShape,所以一直找不到和下面这段类似的

for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) { 
            HSSFClientAnchor anchor = (HSSFClientAnchor) shape.getAnchor();


如果你已经解决了这问题, 能不能帮我一下 , 非常感谢!

1 楼 alex.Lin 2011-11-10  
for (HSSFShape shape : sheet.getDrawingPatriarch().getChildren()) 取不到外部插入的图片

相关推荐

    POI向excel中插入图片

    在本文中,我们将深入探讨如何使用POI库向Excel工作簿中插入图片。这将涵盖相关的API,步骤以及一些实用技巧。 首先,我们需要理解Excel的内部结构。在Excel文件中,图片是以OLE对象的形式存储的。POI提供了...

    poi获取导入行所在的图片

    本知识点主要讲解如何利用Apache POI库来获取Excel文件中某行的图片。 首先,我们要理解Apache POI的工作原理。POI是一个开源项目,它提供了API来读写Microsoft Office格式的文件,包括Excel。在处理Excel文件时,...

    JAVA poi 做EXCEL导出(包含图片) 完整版

    在Java编程环境中,Apache POI库是一个非常实用的工具,用于读取、写入和修改Microsoft Office格式的文件,特别是Excel(.xlsx 和 .xls)文件。本教程将详细介绍如何使用JAVA POI库来创建一个包含图片的完整Excel...

    利用POI解析excel并存入数据库demo

    在这个"利用POI解析excel并存入数据库demo"中,我们将关注如何使用 POI 库来读取 Excel 文件,并将数据有效地存入 MySQL 数据库。 首先,要开始使用 POI,你需要在你的项目中引入相应的依赖。如果你使用的是 Maven...

    excel含图片导入 包含wps嵌入图片 java

    Apache POI提供了API来处理这种二进制数据,开发者可以通过这些API来获取图片数据,并将其保存到本地或者进一步处理。 5. **项目构建**:从压缩包文件名`pom.xml`来看,这是一个使用Maven管理的Java项目。Maven是...

    使用POI,实现excel文件导出,图片url导出文件,图片和excel文件导出压缩包

    在IT行业中,Apache POI是一个广泛使用的库,主要用于读取和写入Microsoft Office格式的文件,尤其是Excel。本文将深入探讨如何使用POI库来实现Excel文件的导出,以及如何将图片URL转换为图片文件并与其他文件一起...

    poi 读取EXCEL所需要的JAR

    在Java环境中,如果你需要使用POI库来读取、写入或操作Excel文件,你需要确保你的项目中包含了正确的JAR文件。在这个场景中,你提到的几个JAR文件都是Apache POI的不同版本和组件: 1. **poi-3.8.jar**:这是Apache...

    java POI读取excel文件数据

    在这个场景中,我们将详细探讨如何使用Java POI读取Excel文件中的数据,包括获取总行数、列数、单元格内容、合并单元格、行高、列宽以及图片等信息。 首先,确保在项目中已经引入了Apache POI的依赖库。如果你使用...

    POI操作Excel完美生成水印

    在Java编程领域,Apache POI 是一个非常流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,包括Excel(XLS和XLSX)。本教程将深入探讨如何利用Apache POI来在Excel文件中完美地生成水印。水印通常...

    java poi导出图片到excel示例代码

    在示例代码中,使用了Java POI读取Excel文件,并将其写入到数据库中。首先,需要创建一个Workbook对象,然后使用Workbook对象的getSheet方法获取Excel文件的Sheet对象,最后使用Sheet对象的getRow方法读取Excel文件...

    POI导出带图片的excel

    在本文中,我们将深入探讨如何使用POI库将图片插入到Excel文档中,以便创建包含图像的丰富报告。 首先,让我们理解POI的基本概念。Apache POI提供了HSSF(Horrible Spreadsheet Format)和XSSF(XML Spreadsheet ...

    图片缩略图以及poi生成excel文档

    平时工作中用到的一些技术点,拿出来和大家共享一下。 有些功能比较粗糙,如果大家有更加完善的示例或建议,欢迎交流。 1、jpg图片缩略图:ImageUtil ...2、poi创建excel:CDSHdlReport 3、计算表达式求值:Cal

    POI读取Excel带格式数据

    然而,压缩包中的文件"svn.bmp"似乎与主题“POI读取Excel带格式数据”不直接相关,它可能是一个图片文件,用于补充说明或示例中的图表。由于无法查看具体内容,这里无法提供更详细的解释。 总的来说,Apache POI是...

    POI导出Excel工具类,自动设置标题 列名 文件名,可插入图片,合并单元格

    在这个场景中,我们关注的是如何使用POI来创建一个功能丰富的Excel导出工具类,它能够自动设置标题、列名、文件名,并且支持插入图片以及合并单元格。下面将详细介绍这些功能的实现。 首先,要创建一个Excel工作簿...

    java poi 获取excel中的图片(包含wps中嵌入单元格图片)

    本篇文章将详细讲解如何使用Java POI库获取Excel文件(包括WPS创建的文件)中的图片,以及如何处理单元格内嵌图片。 首先,让我们了解POI中处理图片的基本概念。POI中的`XSSFWorkbook`和`HSSFWorkbook`类提供了`...

    poi读取excel所需jar包,需要的自取

    标题提到的"poi读取excel所需jar包"主要涉及以下组件: 1. **poi-3.8-20120326.jar**:这是Apache POI的主要库,包含了处理Excel(HSSF和XSSF)以及其他Office文档的核心功能。版本3.8是一个较早的版本,但仍然能够...

    POI导出Excel表格

    在Java编程领域,Apache POI是一个非常流行的库,它允许开发者读取、写入和修改Microsoft Office格式的文件,特别是Excel工作簿(.xls或.xlsx)。在这个“POI导出Excel表格”的实例中,我们将深入探讨如何利用Apache...

    使用poi替换word中的图片

    本篇将深入探讨如何使用Apache POI库来替换Word文档中的图片,无论文档是.doc还是.docx格式。 首先,我们需要理解Apache POI的工作原理。POI提供了一个高级API,允许开发者读取、创建和修改Office文档。对于Word...

    poi读取excel所需jar(完整版)及poi api

    这个“poi读取excel所需jar(完整版)”压缩包应该包含了所有处理Excel所需的POI库文件,确保你可以顺利地在Java项目中进行Excel操作。记得根据你的项目需求选择合适的版本,保持库的更新,以利用最新的特性与修复。

    POI解析EXCEl分层

    由于提供的文件名称“BEI~{CL`@E0D~X6F~@584P.jpg”看起来像是一个图片文件,可能与正文内容无关,因此在讨论POI解析Excel的知识点时,我们无法直接引用这个文件。不过,通常在实际项目中,开发者可能会结合Excel...

Global site tag (gtag.js) - Google Analytics