0

6

回答

1744 浏览

实现网络爬虫与搜索引擎技术都需要配备什么样的资源?[已解决]0

公司准备做一个关于搜索引擎方面的东西,但是本人对这块不是熟悉,都需要配备什么样的资源,比如人才,软件(开源或商业的,开源优先),硬件,网络等,请大家不吝赐教。 大致的要求是能有一个爬虫去一些网站爬数据抓取回来,然后存储在本地。在用搜素技术搜索这些数据和分析这个这些对这些数据进行加工处理,方便用户使用。我们只是要求搜索某一行业的数据,而不是像百度这样可以搜索全网的数据。

0

3

回答

4829 浏览

java网络爬虫获取跳转后的URL[已解决]5

Java网络爬虫,爬取Bai**du的搜索结果,例如访问的URL是http://www.baidu.com/link?url=U3WEcAaa55vMH_mnafZHZyCoofvQ7IdiFW6WOSwL3PCBtaeDKKqHnretlAa-uzQ4,其对应原始的URL是:http://data.tiexue.net/mil/j202110/,在Java中如何得到这个原始的URL?

2013年10月27日 10:50

本周活跃投票用户

最新评论

Global site tag (gtag.js) - Google Analytics