本月博客排行
-
第1名
kaizi1992 -
第2名
arpenker -
第3名
wy_19921005 - hanbaohong
- jh108020
年度博客排行
-
第1名
龙儿筝 -
第2名
宏天软件 -
第3名
青否云后端云 - vipbooks
- wy_19921005
- benladeng5225
- fantaxy025025
- e_e
- kaizi1992
- tanling8334
- arpenker
- sam123456gz
- javashop
- zysnba
- xiangjie88
- lemonhandsome
- wallimn
- ganxueyun
- Xeden
- zhanjia
- xyuma
- wangchen.ily
- jh108020
- johnsmith9th
- zxq_2017
- jbosscn
- forestqqqq
- daizj
- ajinn
- xpenxpen
- 喧嚣求静
- ranbuijj
- kingwell.leng
- silverend
- kristy_yy
- lchb139128
- jveqi
- lich0079
- lzyfn123
- java-007
- sunj
- yeluowuhen
- lerf
- xiaoxinye
- flashsing123
- lxguy
- zhangjijun
- bosschen
- lyndon.lin
- sunnylocus
最新文章列表
ImproveIndexingSpeed(加快索引速度) 转载
原文地址 :http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
How to make indexing faster
Here are some things to try to speed up the indexing speed of your Lucene application. Please see ImproveSe ...
关于BDB-Directory 的问答
问:
Is it possible to turn off directory locking with BDB? How is the performance
compared to regular FSDirectory for queries?
答:
If you're thinking of using Berkeley DB as a the store behind the Luc ...
lucene 学习笔记(1)
从最简单的开始,show me the code,,,(在lucene自带的文档中).
java 代码
Analyzer analyzer = new StandardAnalyzer();
// Store the index in memory:
Directory directory = new RAMDir ...
Re: 初次使用lucene2.0的心得和疑问
1. 没有太明白你的问题,但是感觉你好象理解不对。建立索引和搜索是两个分离的过程,只有在文章增删改的时候才会涉及到索引的操作。搜索操作基于索引操作生成的索引文件。 2. 这个不用担心,如果搜索结果很多,Lucene不是一次性把所有结果都加载到内存中的,而是只把前100条读入内存,当你请求后续数据的时候再继续加载。 3. IndexWriter的第三个参数仅仅表明是否创建索引文件,如果传入的目录中已经 ...
JAVA读取WORD,EXCEL,POWERPOINT,PDF文件的方法
OFFICE文档使用POI控件,PDF可以使用PDFBOX0.7.3控件,完全支持中文,用XPDF也行,不过感觉PDFBOX比较好,而且作者也在更新。水平有限,万望各位指正
WORD:
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.p ...
学习目录 2007-7-8
2007-07-03
java字符集
关注点:客户端字符集与服务器端字符集的协调问题及影响和各字符集的比较
示例:用ajax提交表单,客户端如何对数据进行编码 用urlencode或页面默认字符集
在传输中的字符集的影响和container容器的影响(如apache的rewriter模块就具有 对内容有自动url解码功能),服务器端的代码转换和代码运行环境的默认字符集的影响
参考文 ...
构建基于词典的Lucene分析器(转)
构建基于词典的Lucene分析器
solo L
发布日期:2006年09月03日,更新日期:2006年10月03日
Lucene 是Apache的一个基于Java的开放源代码的搜索软件包,也是目前最为流行的搜索软件包。但是对于绝大多数中文用户来说其提供的两个中文分析器 (ChineseAnalyzer和CJKAnalyzer)的能力又太弱了,因此我们有必要开发适合自己的中文分析器。这篇文章中给出 ...
Jakarta Commons使用总结
浏览了一下《Jakarta Commons Cookbook》(Timothy M. O'Brien)。里面介绍了commons各子项目提供的各种实用类,大致浏览了一遍,做个总结,以后遇到相同的问题可以到commons里去寻找答案。
以下列出一些我认为比较有价值的功能,方便以后参考:
lang:
1)反射地生成hashcode、equals、toString方法。
2)反转数组
3)在数组中搜索指定 ...
Analysis包分析
Analysis包分析 算法和数据结构分析: 由于Analysis包比较简单,不详述了! 算法:基于机械分词 1-gram,2-gram,HMM(如果使用ICTCLAS接口的话) 数据结构:部分源码用到了Set ,HashTable,HashMap 认真理解TokenLucene中的Analysis包专门用于完成对于索引文件的分词.Lucene中的Token是一个非常重要的概念
在 Web 应用程序中集成 Lucene
在 Web 应用程序中集成 Lucene接下来我们开发一个 Web 应用程序利用 Lucene 来检索存放在文件服务器上的 HTML 文档。在开始之前,需要准备如下环境: Eclipse 集成开发环境 Tomcat 5.0 Lucene Library JDK 1.5 这个例子使用 Eclipse 进行 Web 应用程序的开发,最终这个 Web 应用程序跑在 Tomca ...
Lucene开源检索架构预览
在本篇文章中,你会学习到如何利用 Lucene 实现高级搜索功能以及如何利用 Lucene 来创建 Web 搜索应用程序。通过这些学习,你就可以利用 Lucene 来创建自己的搜索应用程序。架构概览通常一个 Web 搜索引擎的架构分为前端和后端两部分,就像图一中所示。在前端流程中,用户在搜索引擎提供的界面中输入要搜索的关键词,这里提到的用户界面一般是一个带有输入框的 Web 页面,然后应用程序将搜索 ...