PPT是一种常用的演示工具,在各行各业都扮演着不可或缺的作用。在处理办公文档的过程中会遇到需要提取文档文本或者图片的情况。如果需要操作的文档包含的文字和图片不是很多的时候,我们尚可手动一点点把内容复制粘贴整理出来,但对于较大的文档,文字和图片内容都比较多的情况,又该如何准确无误地处理?本篇文章提供了实现提取PPT文本和图片的方法。(本文转自:http://www.cnblogs.com/Yesi/p/7770802.html,经测试有效)
注意:要实现上述操作须使用组件Spire.Presentation,安装后添加引用dll文件,同时添加相应的命名空间。具体操作可参考下面的代码。
原PPT文档:
1.提取文本
全部代码如下:
using System; using System.Text; using Spire.Presentation; using System.IO; using System.Diagnostics; namespace ExtractText_PPT { class Program { static void Main(string[] args) { //创建一个Presentation实例并加载文档 Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010); //创建一个StringBuilder类 StringBuilder sb = new StringBuilder(); //遍历文档,提取文本内容 foreach (ISlide slide in presentation.Slides) { foreach (IShape shape in slide.Shapes) { if (shape is IAutoShape) { foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs) { sb.Append(tp.Text + Environment.NewLine); } } } } //保存文档 File.WriteAllText("target.txt", sb.ToString()); Process.Start("target.txt"); } } }
提取出来的文本如下所示:
2.提取文本
2.1 提取全部文本
using Spire.Presentation; using System.Drawing; namespace ExtractImage_PPT { class Program { static void Main(string[] args) { //初始化一个Presentation类实例,并加载文档 Presentation ppt = new Presentation(); ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx"); //遍历文档 for (int i = 0; i < ppt.Images.Count; i++) { Image image = ppt.Images[i].Image; //提取图片 image.Save(string.Format(@"..\..\Images{0}.png", i)); } } } }
效果示例:
2.2提取特定幻灯片的图片
using System.Drawing; using Spire.Presentation; namespace ExtractImageFromSpecialSlides_PPT { class Program { static void Main(string[] args) { //创建一个Presentation类实例,并加载文档 Presentation PPT = new Presentation(); PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx"); //遍历文档,获取第四张幻灯片,提取图片 int i = 0; foreach (IShape s in PPT.Slides[3].Shapes) { if (s is SlidePicture) { SlidePicture ps = s as SlidePicture; ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i)); i++; } if (s is PictureShape) { PictureShape ps = s as PictureShape; ps.EmbedImage.Image.Save(string.Format("{0}.png", i)); i++; } } } } }
效果示例:
相关推荐
C# 提取PPT文本和图片的实现方法是通过编程语言C#来对PowerPoint文件进行操作,以达到提取其中文本和图片内容的目的。对于需要处理大量PPT文档并从中提取数据的场景,这种技术显得非常有用。本文将详细阐述如何在C#...
根据给定的信息,本文将详细解释如何使用C#来生成PPT文档,主要涉及创建文本、图片、多媒体对象以及Flash对象等内容。 ### C# 生成 PPT 的基本原理 在.NET框架下,C#可以通过调用Microsoft Office Interop库来操作...
在.NET框架中,C#程序员可以使用不同的库和方法来创建和编辑PowerPoint(PPT)文件。本文将深入探讨两种常见的C#生成PPT的方法,以帮助开发者更好地理解和实现这个功能。 首先,我们来看第一种方法:使用Microsoft ...
总的来说,C#操作PPT涉及的主要知识点包括:使用Interop库与PowerPoint交互、幻灯片和内容的创建与编辑、文本和图片的插入、动画和过渡效果的设置,以及模板的利用。在实际开发中,根据需求可以进行更复杂的定制和...
这份"C#教程PPT完整版"是学习C#编程的宝贵资源,涵盖了C#语言的核心概念和技术,适合初学者以及希望深入理解C#的开发者。 教程的PDF版内容丰富,主要分为以下几个部分: 1. **语言基础**:这部分讲解了C#的基本...
本示例聚焦于如何使用C#编程语言通过OpenXML SDK来提取PPT文件中的资源,包括音频、视频、图片和文本。这些功能对于在Unity这样的游戏引擎中复用PPT内容尤其有用,例如创建互动式教学或演示场景。 首先,OpenXML ...
本主题聚焦于使用C#处理Office文档,包括DOC(Word文档)、PPT(PowerPoint演示文稿)和EXCEL(电子表格),并将其内容转换成纯文本TXT格式。这种操作在数据提取、文本分析或跨平台兼容性需求时非常有用。 首先,让...
`c#ppt操作.txt`文件可能是更详细的代码示例,它可能包括了上述所有操作的完整实现,也可能包含了一些特定功能的处理,如动画设置、幻灯片的复制或删除等。 总之,C#操作PPT的核心在于理解和使用`Microsoft.Office....
【标题】"C#编写的文本编辑器"是一款利用C#编程语言开发的文本处理工具,它具备基础的文本编辑功能,适用于初学者学习和实践C#编程技术。这款文本编辑器不仅是一个实用的软件,同时也是一份生动的C#教学实例,帮助...
首先创建一个Font对象,设置字体、大小和样式,然后确定页码的位置(通常是图片的右下角),最后调用DrawString绘制文本。 6. **文件操作**:在保存转换后的PNG图片时,需要使用FileStream和Image.Save方法。确保...
利用Aspose.Slides替换模板PPT内文本快速生成PPT
【C# 入门PPT教案详解】 ...总的来说,这份C#入门PPT教案涵盖了C#编程的基本概念、核心语法和控件应用,适合初学者系统学习。通过实践这些知识点,开发者可以逐步掌握C#编程技能,为后续深入学习打下坚实基础。
此外,课程可能会介绍字符串和数组的使用,这是处理文本和数据序列的基本手段。 接着,课程将深入到面向对象编程的概念,讲解类、对象、属性、方法、构造函数和析构函数,这些都是C#中实现封装、继承和多态性的基石...
主要的XML文件包括`ppt/slide1.xml`等,这些文件包含了幻灯片的文本和元素。OpenXML SDK同样可以用来处理这些文件。 除了OpenXML SDK,还有其他第三方库,如NPOI,它是一个针对Microsoft Office文件格式的开源库,...
总的来说,这个"C# ppt,Excel,words,pdf在线预览demo"是一个实用的示例,它展示了如何使用C#在Web环境中处理各种常见文档类型,为开发者提供了在线预览文档的参考架构和技术路线。通过学习和理解这个示例,开发者...
C#不仅是一种强大的编程语言,也被广泛应用于创建交互式和动态的演示文稿,这使得它成为开发PPT的理想选择。通过熟练掌握C#与PowerPoint API的结合,开发者可以构建出高效且功能丰富的教学材料、商业报告或会议演示...
下面我们将深入探讨如何使用C#来创建包含文字、图片和图表的PPT。 首先,为了在C#中操作PPT,我们需要引用Microsoft.Office.Interop.PowerPoint库,这是一个允许C#与PowerPoint进行交互的COM组件。在Visual Studio...