论坛首页 Java企业应用论坛

从PDF导出到Excel的解决办法(附效果)

浏览 9220 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2010-04-28   最后修改:2010-04-29

原先以为PDF导出到Excel可能并不是一件十分困难的事情,搞了整整一天,还没搞定,现在搞了个折中办法,分三步进行:

 

  1. 上传PDF文档
  2. 在服务器端读取PDF文档并生成每页JPG图片,同时生成缩略图
  3. 将所有的PDF读取的图形数据添加到Excel文件中
那么问题来了,数据怎么在Excel里修改呢,不知道大家有没有更好的从PDF导出到Excel的方法?

我的原型效果:http://code.faqee.com/pdf.jsp

从PDF中生成JPG图片代码:

String[] s = { "-imageType", "jpg", path };
PDFToImage.main(s);
非常期待大家的解决思路和办法! 

注:所有的图片,Excel和PDF文件资料将会每隔10分钟系统自动清理一次:)
   发表时间:2010-04-30  
中文乱码,,楼主看看
0 请登录后投票
   发表时间:2010-04-30  
速度还可以就是中文乱码没解决!~~~
0 请登录后投票
   发表时间:2010-04-30   最后修改:2010-04-30
这种实现的效果仅仅是改了个后缀而已...其他完全没变化嘛..


而且楼主没有描述清楚pdf里面是什么内容 导出excel要什么效果...
需求不清晰..如何讨论呀?
0 请登录后投票
   发表时间:2010-04-30  
Angel_Night 写道
这种实现的效果仅仅是改了个后缀而已...其他完全没变化嘛..


而且楼主没有描述清楚pdf里面是什么内容 导出excel要什么效果...
需求不清晰..如何讨论呀?

需要的效果当然是PDF导出到Excel完全格式保持一致,而且是可编辑的:)
不知道是否能实现,支付报酬也可:)
0 请登录后投票
   发表时间:2010-04-30  
pdf导出成word文档可能更好实现吧...

pdf的段落(文章的)什么的放到excel里面 让我感觉压力很大啊...
0 请登录后投票
   发表时间:2010-04-30  
是呀有乱码 这个应该注意呀
0 请登录后投票
   发表时间:2010-04-30   最后修改:2010-04-30
楼主 你可以看看acrobat.jar

它的代码我没认真看 不过跑了几个demo 发现读取pdf还是不错的
对于格式啊 中文啊 都没有发现什么大问题..
0 请登录后投票
   发表时间:2010-04-30  
pdfbox,只能读取简单的excel,复杂的非常非常困难
0 请登录后投票
   发表时间:2010-04-30  
楼主我看中了你的聊天工具 很不错 能否介绍下
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics