`
king_sky_wjb
  • 浏览: 2685 次
  • 性别: Icon_minigender_1
  • 来自: 兰州
最近访客 更多访客>>
社区版块
存档分类
最新评论
文章列表

lucene

Analyzer,文本分析的过程,实质上是将输入文本转化为文本特征向量的过程。 Analyzer包含两个核心组件,Tokenizer以及TokenFilter。两者的区别在于,前者在字符级别处理流,而后者则在词语级别处理流。Tokenizer是Analyzer的第一步,其构造函数接收一个Reader作为参数,而TokenFilter则是一个类似拦截器的东东,其参数可以是TokenStream、Tokenizer,甚至是另一个TokenFilter。整个Lucene Analyzer的过程如下图所示: 1.Analyzer类: Analyzer类是一个抽象类,是所有分析器的基类。为了定义分 ...

Nutch入门白话版

不得不说,Nutch的入门官方文档写的真不清晰明了。害的我按照官方文档折腾半天。   Nutch现在已经到了2.2.2版本,而且版本1.x已经更新到了1.8,这里以1.7为例,1.8中的部分命令行工具的API有变,入门时不是很容易。   #安转运行Nutch#  

JDK介绍

    博客分类:
  • java
JDK开发工具包详解(jar.exe,javadoc.exe...) 一、JDK开发工具包详解 JDK安装完成,进入相应的JDK目录,找到bin目录,会看到很多EXE文件,这些都是JDK的开发工具和实用程序。JDK 工具库中有八种主要程序: Javac:Java编译器,将Java源代码转 ...

JDK

    博客分类:
  • java
JDK(Java Development Kit,Java开发包,Java开发工具)是一个写Java的applet和应用程序的程序开发环境。它由一个处于操作系统层之上的运行环境还有开发者编译,调试和运行用Java语言写的applet和应用程序所需的工具组成。       JDK(Jav ...
Global site tag (gtag.js) - Google Analytics