- 浏览: 708623 次
- 性别:
- 来自: 北京
-
最新评论
-
小小小羊:
好屌...
java.lang.NoClassDefFoundError: org/aspectj/weaver/reflect/ReflectionWorld$Refle -
liubinli2005:
这个可以脱底spring。单独使用吗?
DAO层:jade -
cangbaotu:
我觉得对于开发者来说,能脚本化编写爬虫是一件挺开心的事情( ̄▽ ...
网页爬取 -
asjava:
很好的文章, 但每段代码清单都重复了一次.
spring 事务 -
xia635317478:
jethypc 写道验证码的session无法传过去啊 还是我 ...
登陆验证码(struts2实现)
文章列表
开源CMS
1.InfoGlue
infoglue是一个高级的、可扩展的、健壮的内容管理系统,完全用Java开发。重要的功能包括完全支持多语言,站点之间良好的重用,以及广泛的集成能力。
该项目主页: http://www.infoglue.org
2.Magnolia
Magnolia是一个开源基于Java的Web内容管理系统(CMS) ,构建在Java内容知识库标准(JSR-170).Magnolia支持包括英语,中文在内的14种语言,它支持本地搜索,基于XML的导入/导出,跨浏览器的文本编辑器,一个简易的War文件可部署到任何J2EE容器中。在最新版本中还添加对数字媒体在线编辑功能。
该项 ...
JSP页面头部的标识:<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
为页面添加正确的DOCTYPE
很多设计师和开发者都不知道什么是DOCTYPE,DOCTYPE有什么用。DOCTYPE是document type的简写。主要用来说明你用的XHTML或者HTML是什么版本。浏览器根据你DOCTYPE定义的DTD(文档类型定义)来解释页面代码。所以,如果你不注意设置了错误的DOCTYPE,结果会让你大吃一惊。XHTML1.0提供了三种DOCTYPE可选择:
(1)过渡型(Tra ...
NoSQL官网: http://nosql-database.org/ http://www.mongodb.org/ http://downloads.mongodb.org/win32/mongodb-win32-i386-latest.zip mongodb安装: http://blog.sina.com.cn/s/blog_68cc44950100u2m4.html为什么要用Nosql:
http://www.infoq.com/cn/news/2011/01/nosql-why
http://www.infoq.com/cn/news/2011/02/nosql-archit ...
基于 Lucene 的8 个开源搜索引擎
摘要: Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...Apache SolrSolr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到 ...
Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大...
Apache Solr
什么是垂直搜索引擎?
- 博客分类:
- Lucene全文索引
什么是垂直搜索引擎?
垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。
整个过程中,数据由非结构化数据抽取成结构 ...
Flexigrid表格
1.官网:http://flexigrid.info/
2.http://gundumw100.iteye.com/blog/545610
3.http://www.iteye.com/topic/749437
3.http://www.cnblogs.com/chu888chu888/archive/2009/04/19/1439078.html
搜索引擎的工作原理
一、搜索引擎基本工作原理
了解搜索引擎的工作原理对我们日常搜索应用和网站提交推广都会有很大帮助。
........................................................................................
■ 全文搜索引擎
在搜索 ...
Lucene中文分词 “庖丁解牛”
- 博客分类:
- Lucene全文索引
Lucene中文分词 “庖丁解牛”
参考:
1.http://code.google.com/p/paoding/
2.Qieqie:王志亮Rose:qieqie.wang@gmail.com
http://qieqie.iteye.com/blog/126943
3.http://www.iteye.com/topic/49441
Spring + JMX 入门
参考:
1.http://liangwj72.iteye.com/blog/123842
2.http://lixg425.iteye.com/blog/1876408
3.http://josh-persistence.iteye.com/blog/1870950
4.http://jynine.iteye.com/blog/1876801
Lucene_demo09_txt文件索引
/**
* txt文件索引
*/
public class IndexFile {
private Directory directory;
private String indexPath = "D://lucene/index"; // 建立索引文件的目录
private String dirPath = "D://lucene/data"; // txt资源目录
private IndexWriter indexWriter;
/*
* 获得所 ...
Lucene_demo08_Hightlighter高亮
/*
* 1、使关键字变色 <font color='red'>总冠军</font>
* 2、控制摘要的大小
*/
public class HightlighterTest {
@Test
public void testSearchIndex() throws Exception {
IndexSearcher indexSearcher = new IndexSearcher(LuceneUtils.directory);
QueryParser queryPars ...
Lucene_demo07_Sort匹配度
/**
* @see 1、相同的结构,相同的关键词,得分一样
* @see 2、相同的结构,不同的关键词,得分不一样,一般情况下,中文高于英文
* @see 3、不同的结构,相同的关键词,关键词的得分越高,排名越靠前.关键词出现的频率越高,得分越高
* @see 4、lucene的竞价排名
*/
public class SortTest {
@Test
public void testSearchIndex() throws Exception {
IndexSearcher indexSearcher ...
Lucene简介
IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。
Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有StandardAnalyzer分析器,StopAnalyzer分析器,WhitespaceA ...
ajax跨域问题
跨域访问:http://www.656463.com/article/533
使用jcrop+springmvc实现头像上传:http://www.656463.com/article/505
Lucene_demo06_几种搜索
创建searcher的过程
1、创建Directory
2、根据directory创建indexReader
3、根据indexReader创建indexSearcher
4、创建搜索的Query
5、根据searcher搜索并且返回TopDocs
6、根据TopDocs获取ScordDoc对象获取具体的Document对象
7、根据searcher和ScordDoc对象获取具体的Document对象
8、根据Document对象获取需要的值
9、关闭reader
/**
* @see 1、关键词查询
* @see 2、查询所有的文档 重点
...