阅读更多

8顶
0踩

编程语言

原创新闻 Apache Nutch 1.0 正式版发布

2009-04-10 14:38 by 见习记者 rainsf 评论(3) 有8296人浏览
经常两年的难产,Nutch 终于在3月23日产出具有里程碑意义的1.0版。这一版本在SVN上共提交了144次更新,以前一个版本通常是六七十个更新,由此可见改进了不少。

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

这个版本包含了大量的bug修复以及提升,包括集成 Solr、全新的索引框架以及一个评分框架。

更新详情:http://www.apache.org/dist/lucene/nutch/CHANGES-1.0.txt

下载地址:http://lucene.apache.org/nutch/release/
来自: Apache
8
0
评论 共 3 条 请登录后发表评论
3 楼 langxiashahai 2010-07-08 14:33
apache-nutch-1.0   和 nutch1.0 有什么区别吗? 
2 楼 yhome 2009-06-28 16:16
[/url][url][/url][url[b]][flash=200,200][/flash][flash=200,200][/flash]
[/b]
[/b][b]
1 楼 rainsf 2009-04-10 15:05
NUTCH-601 - Recrawling on existing crawl director

这个更新很有用,以后不用自己写代码实现重爬了。

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

  • Nutch1.0的那些事

    更多感慨是,Nutch已经在今年3月份已经发布了1.0版本,之前研究的Nutch还是0.9版本,其最大的变化并不是版本的升级,而是Nutch已经正式成为了Apache.org的子项目,并且可爱的Hadoop发的速度甚至超过了Nutch本身。...

  • Nutch 正式发布 1.0 版本

    看到消息说 Nutch 正式发布 1.0 版本。这个 Lucene 的衍生项目,现在已经孵化长大。 很早以前我无聊的时候记录过一点使用 Nutch 的笔记(一、二),现在还有人搜过来 :) 时过境迁,已经没啥用啦。 Apache 基金会...

  • 开放源码的搜索引擎Nutch即将发布1.0正式版

    Nutch是一个完全用Java语言写成的开放源码搜索引擎。...Nutch的上一个版本是两年前发布的0.9版,在那之后就一直不断的有人询问什么时候会发布正式的1.0版。直到一个多月前,才有人透露Nutch 1.0会在今年2月发布。可是

  • nutch-1.0添加imdict-chinese-anal…

    昨天在nutch中添加了JE中文分词,今天有试了下基于中科院的多层隐马模型的分词组件,imdict-chinese-analyzer,目前这个组件已经正式集成到lucene-3.0,具体在要用到lucene-analyzers-3.0.1.jar 和 lucene-smartcn-...

  • Hadoop 1.0 到 Hadoop 3.0版本功能概述

    2005年,Hadoop作为Lucene的子项目Nutch的一部分正式引入Apache基金会。2006年2月被分离出来,成为一套完整独立的软件,起名为HadoopHadoop名字不是一个缩写,而是一个生造出来的词。是Hadoop之父Doug Cutting儿子毛...

  • Java工程师成神之路 | 2020正式版

    主要版本 更新时间 备注 v3.0 2020-03-31 知识体系完善,在v2.0的基础上,新增20%左右的知识点调整部分知识的顺序及结构,方便阅读和理解通过GitHub Page搭建,便于阅读 v2.0 ...v1.0 201...

  • 1.2版本之后,Nutch专注的只是爬取数据

    当然在百度百科上这种方法在Nutch1.2之后,已经不再适合这样描述Nutch了,因为在1.2版本之后,Nutch专注的只是爬取数据,而全文检索的部分彻底的交给Lucene和Solr,ES来做了,当然因为他们都是近亲关系,所以Nutch...

  • Java工程师成神之路(2019正式版)

    v1.0 2015-08-01 首次发布 v1.1 2018-03-12 增加新技术知识、完善知识体系 v2.0 2019-02-19 结构调整,更适合从入门到精通;进一步完善知识体系; 新技术补充; 一、基础篇 面向对象 什么是面向对象 面向对象...

  • Java 工程师成神之路 | 2019正式版

    首次发布 v1.1 2018-03-12 增加新技术知识、完善知识体系 v2.0 2019-02-19 结构调整,更适合从入门到精通;进一步完善知识体系; 新技术补充; 1 基础篇 0 1  面向对象 → 什么是面向对象 面向对象、面向过程 面向...

  • Nutch1.8+Hadoop1.2+Solr4.3分布式集群配置

    当然在百度百科上这种方法在Nutch1.2之后,已经不再适合这样描述Nutch了,因为在1.2版本之后,Nutch专注的只是爬取数据,而全文检索的部分彻底的交给Lucene和Solr,ES来做了,当然因为他们都是近亲关系,所以Nutch...

  • Java工程师成神之路 | 2022正式版

    单元测试 junit junit和Spring的结合 mock mockito 内存数据库(h2) 正则表达式 java.lang.util.regex.* 常用的Java工具库 apache-commons google-guava netty API&SPI API API和SPI的关系和区别 如何定义SPI SPI...

  • Apache基金会项目介绍

    项目名称 描述 ...Apache Abdera项目的目标是建立一个功能完备,高效能的IETF Atom联合格式(RFC4287)和Atom发布协议(RFC5023)规范的实现。 Accumulo Apache Accumulo 是一个

  • Java工程师成神之路(2019正式版)

    v1.0 2015-08-01 首次发布 v1.1 2018-03-12 增加新技术知识、完善知识体系 v2.0 2019-02-19 结构调整,更适合从入门到精通;进一步完善知识体系; 新技术补充; 一、基础篇 面向对象 什么是面向对象 面向对象...

  • 星之语明星周边产品销售网站的设计与实现-springboot毕业项目,适合计算机毕-设、实训项目、大作业学习.zip

    Spring Boot是Spring框架的一个模块,它简化了基于Spring应用程序的创建和部署过程。Spring Boot提供了快速启动Spring应用程序的能力,通过自动配置、微服务支持和独立运行的特性,使得开发者能够专注于业务逻辑,而不是配置细节。Spring Boot的核心思想是约定优于配置,它通过自动配置机制,根据项目中添加的依赖自动配置Spring应用。这大大减少了配置文件的编写,提高了开发效率。Spring Boot还支持嵌入式服务器,如Tomcat、Jetty和Undertow,使得开发者无需部署WAR文件到外部服务器即可运行Spring应用。 Java是一种广泛使用的高级编程语言,由Sun Microsystems公司(现为Oracle公司的一部分)在1995年首次发布。Java以其“编写一次,到处运行”(WORA)的特性而闻名,这一特性得益于Java虚拟机(JVM)的使用,它允许Java程序在任何安装了相应JVM的平台上运行,而无需重新编译。Java语言设计之初就是为了跨平台,同时具备面向对象、并发、安全和健壮性等特点。 Java语言广泛应用于企业级应用、移动应用、桌面应用、游戏开发、云计算和物联网等领域。它的语法结构清晰,易于学习和使用,同时提供了丰富的API库,支持多种编程范式,包括面向对象、命令式、函数式和并发编程。Java的强类型系统和自动内存管理减少了程序错误和内存泄漏的风险。随着Java的不断更新和发展,它已经成为一个成熟的生态系统,拥有庞大的开发者社区和持续的技术创新。Java 8引入了Lambda表达式,进一步简化了并发编程和函数式编程的实现。Java 9及以后的版本继续在模块化、性能和安全性方面进行改进,确保Java语言能够适应不断变化的技术需求和市场趋势。 MySQL是一个关系型数据库管理系统(RDBMS),它基于结构化查询语言(SQL)来管理和存储数据。MySQL由瑞典MySQL AB公司开发,并于2008年被Sun Microsystems收购,随后在2010年,Oracle公司收购了Sun Microsystems,从而获得了MySQL的所有权。MySQL以其高性能、可靠性和易用性而闻名,它提供了多种特性来满足不同规模应用程序的需求。作为一个开源解决方案,MySQL拥有一个活跃的社区,不断为其发展和改进做出贡献。它的多线程功能允许同时处理多个查询,而其优化器则可以高效地执行复杂的查询操作。 随着互联网和Web应用的快速发展,MySQL已成为许多开发者和公司的首选数据库之一。它的可扩展性和灵活性使其能够处理从小规模应用到大规模企业级应用的各种需求。通过各种存储引擎,MySQL能够适应不同的数据存储和检索需求,从而为用户提供了高度的定制性和性能优化的可能性。

  • 精选毕设项目-新浪读书.zip

    精选毕设项目-新浪读书

  • 智慧农业平台解决方案.pptx

    智慧农业平台解决方案

  • 精选毕设项目-小程序地图Demo.zip

    精选毕设项目-小程序地图Demo

  • 操作系统课程设计: 并发与调度

    实验目的 在本实验中,通过对事件和互斥体对象的了解,来加深对 Windows Server 2016 线程同步的理解。 1)回顾系统进程、线程的有关概念,加深对 Windows Server 2016 线程的理解; 2)了解事件和互斥体对象; 3)通过分析实验程序,了解管理事件对象的API; 4)了解在进程中如何使用事件对象; 5)了解在进程中如何使用互斥体对象; 6)了解父进程创建子进程的程序设计方法。 程序清单 清单2-1 1.// event 项目   2.#include <windows.h>   3.#include <iostream>   4.using namespace std;   5.   6.// 以下是句柄事件。实际中很可能使用共享的包含文件来进行通讯   7.static LPCTSTR g_szContinueEvent = "w2kdg.EventDemo.event.Continue";   8.   9.// 本方法只是创建了一个进程的副本,以子进程模式 (由命令行指定) 工作    10.BOOL CreateChild()   11.{  

  • 三相VIENNA整流,维也纳整流器simulink仿真 输入电压220v有效值 输出电压800v纹波在1%以内 0.1s后系统稳定 功率因数>0.95 电流THD<5% 开关频率20k 图一为拓扑,可

    三相VIENNA整流,维也纳整流器simulink仿真 输入电压220v有效值 输出电压800v纹波在1%以内 0.1s后系统稳定 功率因数>0.95 电流THD<5% 开关频率20k 图一为拓扑,可以看到功率因数和THD以及输出电压 图二为直流输出电压 图三四为a相电压电流 图五为控制等计算的总体框图 图六为svpwm调制框图 图七为双闭环控制图八为输出调制波 可作为电力电子方向入门学习~~

  • chromedriver-linux64_122.0.6251.0.zip

    chromedriver-linux64_122.0.6251.0

Global site tag (gtag.js) - Google Analytics