`
阅读更多

本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片。

 

工具:

  • Free Spire.Presentation for Java(免费版)
  • IntelliJ IDEA

Jar文件获取及导入:

方法1官网下载jar文件包。下载后,解压文件,并在java程序中导入lib文件夹下的Spire.Presentation.jar文件。

方法2通过maven仓库导入到maven项目。

 

Java代码示例

测试文档:


 

【示例1】读取PPT中的文本

import com.spire.presentation.IAutoShape;
import com.spire.presentation.ISlide;
import com.spire.presentation.ParagraphEx;
import com.spire.presentation.Presentation;
import java.io.FileWriter;

public class ExtractText {
    public static void main(String[]args) throws Exception{
        //加载测试文档
        Presentation ppt = new Presentation();
        ppt.loadFromFile("test.pptx");

        StringBuilder buffer = new StringBuilder();

        //遍历文档中的幻灯片,提取文本
        for (Object slide : ppt.getSlides()) {
            for (Object shape : ((ISlide) slide).getShapes()) {
                if (shape instanceof IAutoShape) {
                    for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) {
                        buffer.append(((ParagraphEx) tp).getText());
                    }
                }
            }
        }
        //保存到文本文件
        FileWriter writer = new FileWriter("ExtractText.txt");
        writer.write(buffer.toString());
        writer.flush();
        writer.close();
    }
}

 文本读取结果:


 

【示例2】读取PPT中的所有图片

import com.spire.presentation.Presentation;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractAllImgs {
    public static void main(String[] args) throws Exception {
        //加载文档
        Presentation ppt = new Presentation();
        ppt.loadFromFile("test.pptx");

        //提取文档中的所有图片
        for (int i = 0; i < ppt.getImages().getCount(); i++) {
            BufferedImage image = ppt.getImages().get(i).getImage();
            ImageIO.write(image, "PNG", new File(String.format("AllImage-%1$s.png", i)));
        }
    }
}

 

【示例3】读取指定幻灯片中的图片

import com.spire.presentation.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractImgsInSpecifiedSlide {
    public static void main(String[]args) throws  Exception{
        //加载文档
        Presentation ppt = new Presentation();
        ppt.loadFromFile("test.pptx");

        //获取第2张幻灯片
        ISlide slide = ppt.getSlides().get(1);

        //提取图片
        for(int i = 0; i< slide.getShapes().getCount(); i++)
        {
            IShape shape = slide.getShapes().get(i);
            if(shape instanceof SlidePicture)
            {
                SlidePicture pic = (SlidePicture) shape;
                BufferedImage image = pic.getPictureFill().getPicture().getEmbedImage().getImage();
                ImageIO.write(image, "PNG",  new File(String.format("extractImageinslide-%1$s.png", i)));
            }
            if(shape instanceof PictureShape)
            {
                PictureShape ps = (PictureShape) shape;
                BufferedImage image = ps.getEmbedImage().getImage();
                ImageIO.write(image, "PNG",  new File(String.format("extractImageinslide-%1$s.png", i)));
            }
        }

    }
}

 

 图片读取结果:


 

(本文完)

 

  • 大小: 246.1 KB
  • 大小: 56.9 KB
  • 大小: 112.9 KB
0
0
分享到:
评论

相关推荐

    如何使用Java读取PPT文本和图片

    【Java读取PPT文本和图片详解】 在Java开发中,有时我们需要处理PPT文档,例如提取其中的文本和图片信息。以下是如何使用Java来实现这一功能的详细步骤。 首先,我们需要一个库来支持对PPT文件的操作。在这个示例...

    POI操作PPT文档(导入,导出,读取,添加,拼接,替换文本,页面排序)

    POI(Apache POI)是一款开源的Java库,用于读取和写入各种Microsoft Office文件格式,包括PPT文档。本文档将介绍如何使用POI操作PPT文档,包括导入、导出、读取、添加、拼接、替换文本、页面排序等操作。 一、POI...

    java-ppt.rar_java .ppt_java ppt_java基础 ppt_java基础 ppt_ppt jav

    压缩包内的"www.pudn.com.txt"可能是记录了更多资源链接或其他相关信息的文本文件,而"java ppt"很可能是实际的Java基础教程PPT,其中可能包含了上述知识点的详细讲解和实例代码。 通过深入学习这些内容,初学者...

    java ppt/pptx转图片所需要的全部jar包

    4. **图形上下文(Graphics2D)**:在Java中,`Graphics2D`是用于二维图形绘制的基础类,它可以实现复杂的图形绘制操作,包括线条、形状、文本和图像。在将幻灯片转换为图片时,`Graphics2D`用于在内存中创建和渲染...

    java 读取PPT

    在Java编程环境中,读取PPT(PowerPoint)文件通常涉及到使用Apache POI库,这是一个强大的API,专门用于处理Microsoft Office格式的文件,包括PPT、Excel和Word。本篇文章将详细阐述如何使用Apache POI读取PPT文件...

    java实现poi模板生成PPT文件代码

    Java中的Apache POI库是一个强大的工具,用于读取、创建和修改Microsoft Office格式的文件,包括PPT(PowerPoint)文档。在这个项目中,我们将会探讨如何使用POI API来生成PPT文件,特别是通过模板的方式。以下是...

    富文本pdf转图片image,图片image转ppt

    总结起来,本文介绍了如何使用Java的PDFBox和Apache POI库,结合Spring Web框架,实现“富文本PDF转图片Image”和“图片Image转PPT”的功能。在实际开发中,还需要考虑性能优化、错误处理、安全性等问题,以提供稳定...

    使用poi操作PPT

    本资源《初始版本》是精简版,《PPT模板生成PPT》是实际项目中的例子,具体就是使用poi去操作PPT,替换PPT中特定的文本,用${key}这种标识在PPT中存放,java代码使用value去替换PPT中的${key},从而生成新的PPT供大家...

    java实现生成ppt文件

    这段代码首先读取本地的图片文件,将其转换为字节数组,然后添加到PPT中。接着,我们创建一个图片形状并设置其位置和大小。 总的来说,Java通过Apache POI库提供了一个强大而灵活的方式来生成PPT文件。开发者可以...

    使用java导出PPT的方法_简单的例子

    Apache POI是一个广泛使用的开源库,它提供了读取、写入Microsoft Office格式文件的能力,包括PPTX(PowerPoint 2007及以后版本)和ppt(PowerPoint 97-2003版本)。因此,你需要在项目中添加Apache POI的依赖。对于...

    利用java poi操作ppt

    Java POI库是一个广泛使用的开源项目,主要用于读取、写入和修改Microsoft Office格式的文件,包括Excel、Word和PowerPoint。在这个特定的话题中,我们将深入探讨如何利用Java POI来操作PPT(PowerPoint)文件。以下...

    java为多种文档(word ppt pdf excel)添加文本水印

    3. **添加PPT文本水印** 对于PowerPoint文档,可以使用Free Spire.Presentation for Java。同样,先导入`com.spire.presentation.*`相关类。加载`Presentation`对象后,遍历每个幻灯片,为每张幻灯片添加`Watermark...

    基于java实现对PPT的增删改查操作源码

    Apache POI是一个流行的开源Java API,它允许开发者创建、修改和显示Microsoft Office格式的文件,包括PPT。在这个项目中,我们利用Apache POI的HSLF(Horrible Slide Library for PowerPoint)组件来处理PPT文件。 ...

    java实现ppt,xls,doc在线预览

    本篇将深入探讨如何使用Java实现PPT、XLS和DOC格式的文件在线预览。 首先,我们要理解这三种文件格式。PPT(PowerPoint)是Microsoft Office套件中的演示文稿格式,用于创建和展示幻灯片。XLS(Excel)则是电子表格...

    经典的Java中文ppt课件

    这些Java中文PPT课件涵盖了Java编程语言的基础到高级主题,是学习和复习Java知识的好资源。以下是对每个章节内容的详细概述: 1. **第一章:Java及其开发环境** - Java的历史背景和发展历程,解释了Java为何成为跨...

    Java Poi流根据Word模板插入相应的文本、表格和图片,并生成新的Word报告。

    在这个场景中,我们关注的是如何利用Java POI库通过Word模板生成包含特定文本、表格和图片的报告。 首先,我们需要了解Java POI中的XWPFDocument类,它是用来处理.docx文件的。XWPFDocument可以读取、修改和创建...

    java ppt

    6. **动画和过渡效果**:尽管Apache POI对这些高级功能的支持不如对文本和形状那么全面,但还是可以通过修改XML结构来实现某些动画和过渡效果。 7. **读取和修改PPT**:除了创建新的PPT文件,Apache POI还可以用来...

    使用POI读写PowerPoint文件(兼容ppt与pptx版本)

    Apache POI是一个流行的开源Java库,专门用于读写Microsoft Office格式的文件,包括PPT和PPTX。本篇将详细介绍如何使用Apache POI来处理这两种不同版本的PowerPoint文件。 首先,让我们了解一下Apache POI的基本...

    免费版 JAVA PPT控件 -Free Spire.Presentation for Java_2.0.0

    它支持功能十分丰富,如添加/编辑/删除幻灯片,创建图表、表格,添加项目符号,加密和解密PPT,添加水印,插入超链接、音频和视频,段落设置,文档属性设置,插入/提取图片,提取文本,设置动画,添加页眉页脚,添加...

    使用java将office word pdf excel ppt文件转换成html文件

    3. **Flying Saucer** - 这是一个Java库,能够将XHTML、CSS和图片转换为高质量的PDF或HTML5。在我们的场景中,它可以帮助将Word、Excel和PPT(经过先转换为XHTML)转换为HTML。 接下来,我们逐一讲解这些库的使用...

Global site tag (gtag.js) - Google Analytics