问答首页→
0
票
3
回答
1338 浏览
Lucene如何索引巨大的PDF文件?[已解决]5
我想用Lucene对一个529G大小的PDF文件进行索引,开始使用Tika1.5,异常为: TIKA-198: Illegal IOException from org.apache.tika.parser.pdf.PDFParser@1455935 org.apache.tika.parser.CompositeParser.parse(CompositeParser.java:248) org ...
2014年5月06日 14:41
0
票
1
回答
342 浏览
pdfbox[已解决]25
各位好: 我需要实现的功能如下: 获取pdf文件中的图片,然后根据这个图片,获取图片上下两行的文本数据。 目前可以提取,每一页的图片,和他的文本信息。但是无法定位到 上下两行。 有没有大虾做过的,或者给他建议。 我找api 找了很久, 但是由于英文很烂,pdfbox的对象模型太多了。也没找到一个从上到下遍历一个页面 的方法。
2013年7月23日 22:49
oznyang 评论了 关于oznyang发布的i18nTool工具的使用
huayang912 评论了 easyui datagrid 弹出窗口空白的解决方法
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
haihuichen 评论了 mybatis联teradata 查询时返回结果集为空,同样的代码在mysql下就可以返回结果集
26762685 评论了 SOS!session串号现象
elbert 评论了 Java怎么实现打印机监控
sandy8508 评论了 Java String.format性能如何
feng_tai_jun 评论了 JSP里加return就会无法编译说Unreachable code
xiaojunjava 评论了 JAVA 连接打印机 打印作业属性设置无效果问题
xiaominzi 评论了 java.security.InvalidAlgorithmParameterException: Prime size must be multiple