`
baeiou
  • 浏览: 4357 次
  • 性别: Icon_minigender_1
  • 来自: 广州
文章分类
社区版块
存档分类
最新评论
文章列表
当用solr的"/update/extract"方法为pdf 或 word 或excel 等文件做索引时,当高亮时总会出现很多回车或空格占了很多空间,让搜索结果时长时短很不好看,而配设中又没有配置可以完成这项目功能,唯一可以实现的就是改源码! 我用的是solr4.7.2的源码去改,源码在以下网址找到 http://grepcode.com/snapshot/repo1.maven.org/maven2/org.apache.solr/solr-cell/4.7.2/ 改的文件是 http://grepcode.com/file/repo1.maven.org/ma ...
溺水的鱼(273654900) 9:57:37 sharing 溺水的鱼(273654900) 9:58:02 如果再慢, 就利用hadoop 溺水的鱼(273654900) 9:58:11 mongodb for hadoop 溺水的鱼(273654900) 9:58:36 sharing  mongodb 可以提高效率 (り、夏执(1306628713) 9:59:35 mongodb for hadoop???这么牛?? py-大军-成都<junwang31@gmail.com> 10:00:37 问一个问题,我有几十亿条记录,怎么从一个数据库导入到另 ...
本人担任职友集的java工程师五年,其中抓取数据占主要的一部分,抓取的信息只要有两部分,职位和简历,其中职位的抓取量为日均插入量为30万,更新量为60万,抓取全国300多个人才网站。职友集(现在改名为跳哪网)现在是 ...
Global site tag (gtag.js) - Google Analytics