- 浏览: 140097 次
- 性别:
- 来自: 南京
文章分类
最新评论
-
zheng_zhimeng:
这个版本在linux的版本下有问题,亲们用的没有问题么
文档展示:IcePDF 将PDF转换为图片 -
yuming.xiao:
转换的某些图片,有些模糊。不知道楼主遇到这个问题没有
文档展示:IcePDF 将PDF转换为图片 -
zenghongqing:
您好,请教您一个问题://cell内容字符串总宽度 doub ...
Java POI Excel 行高自适应 -
xiang37:
http://xiva.iteye.com/blog/2066 ...
视频分割项目预研 -
I白I:
怎么还配置数据库了?
视频分割项目预研
上接 文档展示:PDFBox 将PDF转换为图片
http://zhuyufufu.iteye.com/blog/2009600
上面链接的文章展示了使用PDFBox转PDF为图片,但是有问题:
1.当PDF文档为180M大小时直接报解析异常 (通过加大堆内存可解决)
2.当PDF页数为500多页时处理非常慢
3.测试例子中出现中文正常,英文数字括号乱码的情况
4.jar包很大,达到9M以上
换个组件使用PDFRender来实现例子
上代码:
结果:
能够正常转换PDF为图片,没有乱码
问题:
1.转换的图片稍毛糙
2.在PDF超过500页时和PDFBox一样慢的令人难以忍受,看来只有做多线程处理了
PDF转图片效果最好的还是Adobe Acrobat X Pro,但是它没有提供程序调用接口,还是收费软件,好像也不支持Linux
还有两天的技术预研时间,接下来研究下文档转换为HTML
http://zhuyufufu.iteye.com/blog/2009600
上面链接的文章展示了使用PDFBox转PDF为图片,但是有问题:
1.当PDF文档为180M大小时直接报解析异常 (通过加大堆内存可解决)
2.当PDF页数为500多页时处理非常慢
3.测试例子中出现中文正常,英文数字括号乱码的情况
4.jar包很大,达到9M以上
换个组件使用PDFRender来实现例子
上代码:
package com.zas.pdfrender.test; import java.awt.Graphics2D; import java.awt.Image; import java.awt.Rectangle; import java.awt.RenderingHints; import java.awt.image.BufferedImage; import java.io.File; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOException; import java.io.RandomAccessFile; import java.nio.ByteBuffer; import java.nio.channels.FileChannel; import com.sun.image.codec.jpeg.JPEGCodec; import com.sun.image.codec.jpeg.JPEGEncodeParam; import com.sun.image.codec.jpeg.JPEGImageEncoder; import com.sun.pdfview.PDFFile; import com.sun.pdfview.PDFPage; public class PDFRenderTest { public static void convert(String inputPDFPath, String outputFDir) throws IOException, FileNotFoundException { //pdf文件存在校验,输出文件夹创建 File file = new File(inputPDFPath); if(!file.exists()){ throw new FileNotFoundException("文件不存在: " + inputPDFPath); } File outputFolder = new File(outputFDir); if(!outputFolder.exists()){ outputFolder.mkdirs(); } //获取PDFFile RandomAccessFile raf = new RandomAccessFile(file, "r"); FileChannel channel = raf.getChannel(); ByteBuffer buf = channel.map(FileChannel.MapMode.READ_ONLY, 0, channel.size()); channel.close(); raf.close(); PDFFile pdffile = new PDFFile(buf); System.out.println("PDF页数: " + pdffile.getNumPages() + " , " + inputPDFPath); //转化处理 for (int i = 1; i <= pdffile.getNumPages(); i++) { PDFPage page = pdffile.getPage(i); Rectangle rect = new Rectangle(0, 0, (int) page.getBBox().getWidth(), (int) page.getBBox().getHeight()); Image img = page.getImage(rect.width, rect.height, // width & height rect, // clip rect null, // null for the ImageObserver true, // fill background with white true // block until drawing is done ); BufferedImage tag = new BufferedImage(rect.width, rect.height, BufferedImage.TYPE_INT_RGB); Graphics2D g=tag.createGraphics(); //g.setRenderingHint(RenderingHints.KEY_ANTIALIASING, RenderingHints.VALUE_ANTIALIAS_ON); g.drawImage(img, 0, 0, rect.width, rect.height, null); FileOutputStream out = new FileOutputStream(outputFDir + i + i + ".png"); // 输出到文件流 JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(out); JPEGEncodeParam param2 = encoder.getDefaultJPEGEncodeParam(tag); param2.setQuality(1f, false);// 1f是提高生成的图片质量 encoder.setJPEGEncodeParam(param2); encoder.encode(tag); // JPEG编码 out.close(); } } public static void main(final String[] args) throws FileNotFoundException, IOException { String inputPDFPath = "D:\\pdf\\ppt\\2010110档案管理系统需求分析说明书正式.pdf"; String outputFDir = "D:\\pdf\\222222222222010110系统需求分析说明书正式\\"; PDFRenderTest.convert(inputPDFPath, outputFDir); } }
结果:
能够正常转换PDF为图片,没有乱码
问题:
1.转换的图片稍毛糙
2.在PDF超过500页时和PDFBox一样慢的令人难以忍受,看来只有做多线程处理了
PDF转图片效果最好的还是Adobe Acrobat X Pro,但是它没有提供程序调用接口,还是收费软件,好像也不支持Linux
还有两天的技术预研时间,接下来研究下文档转换为HTML
发表评论
-
oracle按照某一字段里的数字排序
2014-10-21 19:59 1099select * from LSK_SBCAJ t ord ... -
JS onkeydown onenter
2014-10-20 16:53 1014html中 onenter不是一个标准的事件。 js 中仿o ... -
Java数组删除指定元素
2014-09-18 11:30 2272package com.zas.util; impo ... -
sql 去重
2014-09-18 10:43 673delete from table t1 where t1.i ... -
linux 干掉所有java进程
2014-08-07 12:31 1041ps -ef|grep java|grep -v grep|c ... -
Oracle自带连接池使用(转载收录)
2014-07-31 10:01 1423最近在搞数据迁移:从sql server 迁数据到oracle ... -
html dom jsoup httpclient
2014-07-10 21:45 1141xml dom 对大多数java程序员来说并不陌生,但是htm ... -
Oracle 清库脚本
2014-07-08 22:40 1330清库脚本一份 表dossier_group 的字段Dossi ... -
Java 对象存储到oracle Blob字段
2014-07-08 14:52 1112Java 数据对象在没有持久存储到业务表时,可能需要临时存 ... -
Java 科学计数法数字转字符串
2014-07-08 14:30 1529科学计数法数字转字符串,记录代码,留后使用 double ... -
突破tomcat jsp编译65535行的限制
2014-07-04 17:16 4821使用tomcat时有可能会遇到其对jsp编译行数的限制, ... -
oracle 函数中游标及递归的应用
2014-06-19 17:13 1437在代码中使用递归可能大部分程序员都不陌生,但是在存储过程或 ... -
视频操作类
2014-06-19 17:04 1161接 视频分割项目预研 http://zhuyufufu.i ... -
视频分割项目预研
2014-06-11 16:12 2300由于工作需要,研究下视频切割。 现在的情况:视频切割是重中之 ... -
Java POI Excel 行高自适应
2014-03-28 14:08 15974在Excel处理的过程中,可能有需要用到行高自适应的时候。 ... -
Java POI Excel sheet 合并遇到的问题解决2
2014-03-25 18:03 3290上接 Java POI Excel sheet 合并 http ... -
文档展示:使用iText转换各种图片为PDF
2014-03-23 12:38 2939如题: 下面这段代码可以处理各种格式的图片,代码的出处忘记了 ... -
Java 进程执行外部程序,造成外部程序阻塞的一种原因
2014-03-23 12:06 1474前一阵子在研究文档展示时使用了java进程直接调用外部程序 ... -
Java POI Excel sheet 合并遇到的问题解决
2014-03-23 11:30 5164上接 Java POI Excel sheet http:// ... -
Java POI Excel sheet合并
2014-03-19 10:59 6659由于工作上的需要,特地研究了下Excel合并的问题,现贴出来, ...
相关推荐
在文档管理系统中,为了保护版权,可以将PDF转换为图片,防止直接复制文本;又或者在数据分析中,如果需要对PDF中的图表进行自动化处理,转换成图片后能更容易地进行图像识别和分析。 描述中提到的"附带转换代码...
- 图像转换:将PDF转换为图像,实际上是将PDF的每一页解析并渲染成一个图像文件。这通常涉及到色彩空间的转换、分辨率设置、图像质量控制等技术。 3. iText 7中的PDF到图像转换: - iText 7提供`PdfRenderer`类,...
O2S.Components.PDFRender4NET是一个专门用于将PDF文档转换为图像的DLL库,它提供了一种简单高效的方式来处理PDF到图片的转换。在C#工程中,我们可以通过引用这个DLL并调用其内部方法,实现快速且灵活的转换功能。 ...
PDF文档在许多场景下是必不可少的,但有时我们需要将PDF转换为图片格式,例如为了方便在网页上展示或在不支持PDF阅读的设备上查看。本压缩包"PDF文档转换为图片pdf.zip"提供了一个解决方案,它包含了"O2S.Components...
以下是一个使用PDFRender4NET将PDF转换为图片的C#示例代码: ```csharp using System; using System.Drawing; using pdf2image.O2S.Components.PDFRender4NET; class Program { static void Main(string[] args) ...
PDFRender4NET是一款针对C#开发者的专业PDF转换工具,主要功能是将PDF文档转换为图像格式。在标题和描述中提到的“O2S.Components.PDFRender4NET.dllv2.4.3”是该组件的具体版本,适用于C#环境,且强调是官方正版,...
`convert-pdf.jar`很可能是一个Java编写的可执行程序,它实现了将PDF转换为图片的逻辑。在Linux中,我们可以用Java的JAR文件执行Java代码。`convertPdfToImg.sh`则是一个Shell脚本,它包含了调用jar包并执行转换的...
首先,PDFRender4NET提供了PDF文档的高质量渲染,支持将PDF页面转换为图像,这对于预览、保存或打印PDF非常有用。在C#项目中,你可以通过引用`O2S.Components.PDFRender4NET_4.7.3_无水印版本.dll`这个库来调用其API...
总之,PDFRender4NET是一个强大且易于使用的库,它提供了将PDF转换为高质量图片的功能,适合各种.NET项目中的PDF处理需求。正确引用和使用该库,可以极大地提高开发效率,简化PDF到图片的转换过程。
它提供了丰富的API接口,允许开发者将PDF文档转换为图像,或者在应用程序中直接显示PDF内容。这个特定的版本"O2S.Components.PDFRender4NET4.5.1.2"包含了对破解无水印功能的更新,意味着用户可以使用该组件生成...
1. 在线预览:网站可以将PDF文档转换为图片,然后以幻灯片形式展示,避免用户必须下载整个PDF。 2. 数据抓取:通过转换PDF为图像,可以使用OCR(光学字符识别)技术提取文本信息。 3. 安全分享:将PDF转为图片可以...
PDFRender4NET是一款用于.NET平台的库,专为C#开发者设计,用于将PDF文档转换成高质量的图像格式。这个库提供了高效的API,使得在C#应用中处理PDF到图像的转换变得简单易行。在本文中,我们将深入探讨如何使用O2S....
PDFRender4NET是一个用于PDF文档处理的组件,主要功能是将PDF文档转换为图像格式。在.NET环境中,这个组件提供了一种高效且便捷的方式,来处理PDF文件,特别是在需要将PDF页面转化为静态图片的场景中非常有用。下面...
本资源为C#下调用o2s.components.pdfrender4net,把PDF文档转为图片的示例,内含O2S.Components.PDFRender4NET.dll(version:4.5.1.2)这个库,也包含转换示例代码,demo功能为把本地的一个PDF转为一张图片,然后以...
PDFRender4NET是一款用于在.NET环境中处理PDF文档的组件,主要功能是将PDF文档转换为图像。这个组件的特色在于其提供的DLL库和转换源码类,用户可以直接在自己的项目中引用,进行PDF到图像的转换操作,而且据描述所...
PDF转换为图片是一种常见的需求,尤其在数据可视化、文档共享或网页设计中。这个压缩包文件"pdf2image.O2S.Components.PDFRender4NET.zip"包含了几种不同的.NET组件和库,它们允许开发者将PDF文档转换为图像格式。...
这个组件主要用于将PDF文档转换为图像或其他可显示的格式,以便在Web应用程序或者桌面应用程序中进行展示,而无需依赖Adobe Acrobat等PDF阅读器。在"O2S.Components.PDFRender4NET4.5.1.rar"压缩包中,包含了该组件...
然而,在某些情况下,我们可能需要将PDF转换为图片,以便于在网络上分享、嵌入到网页中或者进行进一步的图像处理。本教程将详细介绍如何使用C#编程语言和第三方库O2S.Components.PDFRender4NET来实现这个功能。 ...
PDF转图片是一个常见的需求,尤其在处理大量PDF文档并需要以图像形式进行展示或存储时。O2S.Components.PDFRender4NET.dll 是一个专门用于将PDF文档转换为图像格式的组件,它提供了32位和64位的兼容性,以适应不同...