0

6

回答

1748 浏览

实现网络爬虫与搜索引擎技术都需要配备什么样的资源?[已解决]0

公司准备做一个关于搜索引擎方面的东西,但是本人对这块不是熟悉,都需要配备什么样的资源,比如人才,软件(开源或商业的,开源优先),硬件,网络等,请大家不吝赐教。 大致的要求是能有一个爬虫去一些网站爬数据抓取回来,然后存储在本地。在用搜素技术搜索这些数据和分析这个这些对这些数据进行加工处理,方便用户使用。我们只是要求搜索某一行业的数据,而不是像百度这样可以搜索全网的数据。

0

3

回答

271 浏览

关于HTML正文提取算法的请教[已解决]3

请问大家介绍一下html正文提取算法。或者有哪些开源的实现。多谢了。

2011年12月19日 09:20
0

1

回答

165 浏览

lucene全文检索小问题[已解决]5

在全文检索中,在创建索引文件的时候,如果类(javaBean)有引用的类,我要检索引用类中的内容是否有匹配的,这种情况怎么办呢。

2010年10月05日 23:31
0

1

回答

249 浏览

学习搜索引擎理论,需要哪些数学基础?[已解决]3

学习搜索引擎理论,需要掌握哪些数学基础? 编写企业级搜索引擎,需要哪些知识? 什么书籍能帮助提高! 谢谢!

2010年10月02日 15:17
0

0

回答

139 浏览

帮忙解决一个lucence分页问题[已解决]10

在问题贴里面没人理了...真可怜...无奈到论坛发一贴...请原谅...希望有人能帮我解决一下..谢谢 http://www.iteye.com/problems/44574

2010年6月18日 21:23
0

0

回答

486 浏览

关于lucence分页问题[已解决]5

版本为3.0 在lucence中的IndexSearcher中通过search()方法查询本地索引文件。 关于search的方法有: public TopDocs search(Query query, int n) public TopDocs search(Query query, Filter filter, int n) public TopFieldDocs search(Query q ...

2010年6月18日 14:38
0

3

回答

227 浏览

没有Spring如何配置compass的增量索引[已解决]3

手头有一个项目,只用了struts和hibernate,没有使用Spring,那么如何配置compass的GpsDevice呢?配置文件如何写?我在网上查了查,都是针对有Spring的配置,难道没有Spring就用不了compass吗?

2009年4月16日 18:50
0

4

回答

393 浏览

关于对 word 、PDF等常见格式文档的 内容的搜索[已解决]3

现在上传 word 文档 或者PDF 文档到服务器硬盘上面 或者 以流的方式存储到数据库中,做一个搜索,要求可以对word文档 或者 PDF 文档的 内容 进行搜索,如何实现这样的技术?各位有什么建议 ,给提示提示,有参考文档最好,多谢!

2009年3月16日 11:49
0

2

回答

270 浏览

lucence如何实现淘宝那样的结果分类[已解决]10

RT,有什么好办法么?我现在是搜N次但是效率很低并发也少的可怜。。。只想搜一次再for判断,但是结果可能上百万条几率也影响效率,请问该怎样很好的解决这个办法?索引文件上可以做什么修改么?请赐教问题补充:但是问题是lucene每次只返回前100条

2008年7月03日 09:06

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics