锁定老帖子 主题:Nutch框架
该帖已经被评为隐藏帖
|
|||||
---|---|---|---|---|---|
作者 | 正文 | ||||
发表时间:2010-01-10
最后修改:2010-01-10
在接触到一个新的事物的时候,根据人的认知过程,我们势必要知道这个新事物的是什么,即What;然后,便是为什么要认知这个新的事物,如果没有任何理由的话说明完全没有必要去了解它,因为它可能对我们没有一点用处,这就是所谓的Why;接着就是How,该如何认知一个新的事物,使用什么样的方式和手段,只有在通过逐步的迭代执行What这个步骤和实施How,我们才能逐步了解、认识、理解这个新事物,使其为我所使用。 这里,我们主要对What和Why进行阐述。 Nutch简介 Nutch是一个使用Java编写的开源的搜索引擎框架,这就是关于Nutch的What的初步认识。既然是搜索引擎框架,自然而然是实现了类似于搜索引擎的功能,这是在你知道百度、Google等搜索引擎是干什么用的(即搜索引擎的功能)这个基础上理解的。 能否具体一点呢?关于Nutch更加详细的信息,这里要谈到开源框架Lucene,Nutch是Lucene工程的一个子项目,它们之间是存在联系的,引用一段文字说明:
通过上面引用的叙述,可以知道,Nutch应该具有抓取数据的功能。在获取到抓取的数据以后,就可以使用Lucene提供的API实现文本索引和信息检索。 Nutch架构 然后,Nutch具有了抓取数据的功能,它还具有那些功能呢?即更深一层的What执行——能做些什么。 Nutch 能够提供了我们运行自己的搜索引擎所需的全部工具。至于提供了哪些工具呢?这就需要从Nutch的架构设计来探讨:
Nutch安装 扩展一下关于Nutch:
可见,Nutch支持分布式处理。 选择Nutch的理由 这里,通过上面已经对Nutch有了一定的了解,在这个基础上,可以执行Why了,即为什么要选择Nutch。引用一段文字:
具备了上面的认识,应该可以通过更加深化的迭代What来实现How,即如何部署运行Nutch。 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|||||
返回顶楼 | |||||
发表时间:2010-01-11
最后修改:2010-01-11
ibc789 写道
在接触到一个新的事物的时候,根据人的认知过程,我们势必要知道这个新事物的是什么,即What;然后,便是为什么要认知这个新的事物,如果没有任何理由的话说明完全没有必要去了解它,因为它可能对我们没有一点用处,这就是所谓的Why;接着就是How,该如何认知一个新的事物,使用什么样的方式和手段,只有在通过逐步的迭代执行What这个步骤和实施How,我们才能逐步了解、认识、理解这个新事物,使其为我所使用。 这里,我们主要对What和Why进行阐述。 Nutch简介 Nutch是一个使用Java编写的开源的搜索引擎框架,这就是关于Nutch的What的初步认识。既然是搜索引擎框架,自然而然是实现了类似于搜索引擎的功能,这是在你知道百度、Google等搜索引擎是干什么用的(即搜索引擎的功能)这个基础上理解的。 能否具体一点呢?关于Nutch更加详细的信息,这里要谈到开源框架Lucene,Nutch是Lucene工程的一个子项目,它们之间是存在联系的,引用一段文字说明:
通过上面引用的叙述,可以知道,Nutch应该具有抓取数据的功能。在获取到抓取的数据以后,就可以使用Lucene提供的API实现文本索引和信息检索。 Nutch架构 然后,Nutch具有了抓取数据的功能,它还具有那些功能呢?即更深一层的What执行——能做些什么。 Nutch 能够提供了我们运行自己的搜索引擎所需的全部工具。至于提供了哪些工具呢?这就需要从Nutch的架构设计来探讨:
Nutch安装 扩展一下关于Nutch:
可见,Nutch支持分布式处理。 选择Nutch的理由 这里,通过上面已经对Nutch有了一定的了解,在这个基础上,可以执行Why了,即为什么要选择Nutch。引用一段文字:
具备了上面的认识,应该可以通过更加深化的迭代What来实现How,即如何部署运行Nutch。
|
|||||
返回顶楼 | |||||
浏览 3411 次