- 浏览: 70471 次
- 性别:
- 来自: 北京
-
文章分类
- 全部博客 (121)
- luence (7)
- MoveLuceneRebuild (0)
- ehcache (0)
- memcached (12)
- WeiXin (1)
- hy (0)
- alipay (0)
- Wxap (0)
- 学习笔记 (14)
- java generic (1)
- threadpool (0)
- Awmazon (0)
- com.yulong.businessCache (0)
- com.yulong.util (1)
- com.wxap (0)
- com.yulong.wxshop (0)
- com.alipay (0)
- com.yulong.session (0)
- com.yulong.handler (0)
- kafka (0)
- http://www.cnblogs.com/oubo/archive/2012/02/04/2394646.html (0)
- redis (0)
- MongoDB (2)
- Nginx (1)
- java (10)
- 云搜索 (4)
- Hadoop (1)
- Spring (15)
- Thread (1)
- 博客链接 (0)
- AJAX与CSS (7)
- 项目管理 (1)
- restful架构 (1)
- 多线程 (3)
- Java面试 (6)
- 牛人博客 (2)
- Linux (1)
- java集合 (1)
- Socket与Nio (1)
- SQL开发 (2)
- Spring Boot (3)
- Spring4.1 (4)
- tomcat配置 (1)
- JVM (5)
- Hibernate (1)
- Dubbo (7)
- MQ (2)
- java常见错误 (0)
最新评论
package com.yulong.lucene.core;
import net.teamhot.lucene.ThesaurusAnalyzer;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.cjk.CJKAnalyzer;
import org.apache.lucene.analysis.cn.ChineseAnalyzer;
import org.wltea.analyzer.lucene.IKAnalyzer;
public class LuceneContacts {
// LUCENE跟文件路径
public static String lucene_root_path = "X:/index";
// 临时文件大小
public static int tempsize = 0;
// 临时文件检查时间间隔(分钟)
public static int timesize = 5;
// 优先提取的文档数
public static int topsszie = 100;
// 索引读写池子
// public static LucenePool iwpool = null;
public static LucenePool iwpool = new LucenePool();
// 系统支持的分词系统
public static Analyzer analyzers[] = new Analyzer[4];
static{
analyzers[0] = new CJKAnalyzer();
analyzers[1] = new ThesaurusAnalyzer();//自定义词库包
analyzers[2] = new ChineseAnalyzer();//data/chars.dic 是单字与语料中的频率 data/units.dic 是单字的单位 data/words.dic 是词库文件,一行一词
analyzers[3] = new IKAnalyzer();//data/chars.dic 是单字与语料中的频率 data/units.dic 是单字的单位 data/words.dic 是词库文件,一行一词
}
// WhitespaceAnalyzer:仅仅是去除空格,对字符没有lowcase化,不支持中文
// SimpleAnalyzer:功能强于WhitespaceAnalyzer,将除去letter之外的符号全部过滤掉,并且将所有的字符lowcase化,不支持中文 http://www.itonghui.com
// StopAnalyzer:StopAnalyzer的功能超越了SimpleAnalyzer,在SimpleAnalyzer的基础上 增加了去除StopWords的功能,不支持中文
// StandardAnalyzer:英文的处理能力同于StopAnalyzer.支持中文采用的方法为单字切分. http://www.chinakdd.com
// ChineseAnalyzer:来自于Lucene的sand box.性能类似于StandardAnalyzer,缺点是不支持中英文混和分词.
// CJKAnalyzer:chedong写的CJKAnalyzer的功能在英文处理上的功能和StandardAnalyzer相同但是在汉语的分词上,不能过滤掉标点符号,即使用二元切分
// 当前使用的分词
public static Analyzer analyzer = analyzers[1];
// ============================== 各类文件的路径组成 ======================
// 新闻系统的索引跟路径
public static String lucene_cms_root_path = "cmsLucene/";
// 文章操作记录备份
public static String lucene_cms_logs_path = "cmsLogs/cmshistory";
}
import net.teamhot.lucene.ThesaurusAnalyzer;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.cjk.CJKAnalyzer;
import org.apache.lucene.analysis.cn.ChineseAnalyzer;
import org.wltea.analyzer.lucene.IKAnalyzer;
public class LuceneContacts {
// LUCENE跟文件路径
public static String lucene_root_path = "X:/index";
// 临时文件大小
public static int tempsize = 0;
// 临时文件检查时间间隔(分钟)
public static int timesize = 5;
// 优先提取的文档数
public static int topsszie = 100;
// 索引读写池子
// public static LucenePool iwpool = null;
public static LucenePool iwpool = new LucenePool();
// 系统支持的分词系统
public static Analyzer analyzers[] = new Analyzer[4];
static{
analyzers[0] = new CJKAnalyzer();
analyzers[1] = new ThesaurusAnalyzer();//自定义词库包
analyzers[2] = new ChineseAnalyzer();//data/chars.dic 是单字与语料中的频率 data/units.dic 是单字的单位 data/words.dic 是词库文件,一行一词
analyzers[3] = new IKAnalyzer();//data/chars.dic 是单字与语料中的频率 data/units.dic 是单字的单位 data/words.dic 是词库文件,一行一词
}
// WhitespaceAnalyzer:仅仅是去除空格,对字符没有lowcase化,不支持中文
// SimpleAnalyzer:功能强于WhitespaceAnalyzer,将除去letter之外的符号全部过滤掉,并且将所有的字符lowcase化,不支持中文 http://www.itonghui.com
// StopAnalyzer:StopAnalyzer的功能超越了SimpleAnalyzer,在SimpleAnalyzer的基础上 增加了去除StopWords的功能,不支持中文
// StandardAnalyzer:英文的处理能力同于StopAnalyzer.支持中文采用的方法为单字切分. http://www.chinakdd.com
// ChineseAnalyzer:来自于Lucene的sand box.性能类似于StandardAnalyzer,缺点是不支持中英文混和分词.
// CJKAnalyzer:chedong写的CJKAnalyzer的功能在英文处理上的功能和StandardAnalyzer相同但是在汉语的分词上,不能过滤掉标点符号,即使用二元切分
// 当前使用的分词
public static Analyzer analyzer = analyzers[1];
// ============================== 各类文件的路径组成 ======================
// 新闻系统的索引跟路径
public static String lucene_cms_root_path = "cmsLucene/";
// 文章操作记录备份
public static String lucene_cms_logs_path = "cmsLogs/cmshistory";
}
发表评论
-
TestIndex
2014-11-07 11:55 0package com.yulong.lucene.test; ... -
RequestUtil
2014-11-07 11:41 0package com.yulong.lucene.util; ... -
SearchLuceneForCmsLog
2014-11-07 11:40 0package com.yulong.lucene.biz; ... -
LabelUtil
2014-11-07 11:38 0package com.yulong.lucene.util; ... -
LucenePool
2014-11-07 11:36 315package com.yulong.lucene.core; ... -
WriteLucene
2014-11-07 11:35 486package com.yulong.lucene.biz; ... -
SearchLuceneForAdmin
2014-11-07 11:33 0package com.yulong.lucene.biz; ... -
RebuildLucene
2014-11-07 11:32 407package com.yulong.lucene.biz; ... -
MoveLuceneSmall
2014-11-06 10:01 333package com.yulong.lucene.biz; ... -
MoveLuceneRebuild
2014-11-06 09:59 319package com.yulong.lucene.biz; ... -
luence
2014-11-06 09:54 333@SuppressWarnings({ "unche ...
相关推荐
嵌入式八股文面试题库资料知识宝典-华为的面试试题.zip
训练导控系统设计.pdf
嵌入式八股文面试题库资料知识宝典-网络编程.zip
人脸转正GAN模型的高效压缩.pdf
少儿编程scratch项目源代码文件案例素材-几何冲刺 转瞬即逝.zip
少儿编程scratch项目源代码文件案例素材-鸡蛋.zip
嵌入式系统_USB设备枚举与HID通信_CH559单片机USB主机键盘鼠标复合设备控制_基于CH559单片机的USB主机模式设备枚举与键盘鼠标数据收发系统支持复合设备识别与HID
嵌入式八股文面试题库资料知识宝典-linux常见面试题.zip
面向智慧工地的压力机在线数据的预警应用开发.pdf
基于Unity3D的鱼类运动行为可视化研究.pdf
少儿编程scratch项目源代码文件案例素材-霍格沃茨魔法学校.zip
少儿编程scratch项目源代码文件案例素材-金币冲刺.zip
内容概要:本文深入探讨了HarmonyOS编译构建子系统的作用及其技术细节。作为鸿蒙操作系统背后的关键技术之一,编译构建子系统通过GN和Ninja工具实现了高效的源代码到机器代码的转换,确保了系统的稳定性和性能优化。该系统不仅支持多系统版本构建、芯片厂商定制,还具备强大的调试与维护能力。其高效编译速度、灵活性和可扩展性使其在华为设备和其他智能终端中发挥了重要作用。文章还比较了HarmonyOS编译构建子系统与安卓和iOS编译系统的异同,并展望了其未来的发展趋势和技术演进方向。; 适合人群:对操作系统底层技术感兴趣的开发者、工程师和技术爱好者。; 使用场景及目标:①了解HarmonyOS编译构建子系统的基本概念和工作原理;②掌握其在不同设备上的应用和优化策略;③对比HarmonyOS与安卓、iOS编译系统的差异;④探索其未来发展方向和技术演进路径。; 其他说明:本文详细介绍了HarmonyOS编译构建子系统的架构设计、核心功能和实际应用案例,强调了其在万物互联时代的重要性和潜力。阅读时建议重点关注编译构建子系统的独特优势及其对鸿蒙生态系统的深远影响。
嵌入式八股文面试题库资料知识宝典-奇虎360 2015校园招聘C++研发工程师笔试题.zip
嵌入式八股文面试题库资料知识宝典-腾讯2014校园招聘C语言笔试题(附答案).zip
双种群变异策略改进RWCE算法优化换热网络.pdf
内容概要:本文详细介绍了基于瞬时无功功率理论的三电平有源电力滤波器(APF)仿真研究。主要内容涵盖并联型APF的工作原理、三相三电平NPC结构、谐波检测方法(ipiq)、双闭环控制策略(电压外环+电流内环PI控制)以及SVPWM矢量调制技术。仿真结果显示,在APF投入前后,电网电流THD从21.9%降至3.77%,显著提高了电能质量。 适用人群:从事电力系统研究、电力电子技术开发的专业人士,尤其是对有源电力滤波器及其仿真感兴趣的工程师和技术人员。 使用场景及目标:适用于需要解决电力系统中谐波污染和无功补偿问题的研究项目。目标是通过仿真验证APF的有效性和可行性,优化电力系统的电能质量。 其他说明:文中提到的仿真模型涉及多个关键模块,如三相交流电压模块、非线性负载、信号采集模块、LC滤波器模块等,这些模块的设计和协同工作对于实现良好的谐波抑制和无功补偿至关重要。
内容概要:本文探讨了在工业自动化和物联网交汇背景下,构建OPC DA转MQTT网关软件的需求及其具体实现方法。文中详细介绍了如何利用Python编程语言及相关库(如OpenOPC用于读取OPC DA数据,paho-mqtt用于MQTT消息传递),完成从OPC DA数据解析、格式转换到最终通过MQTT协议发布数据的关键步骤。此外,还讨论了针对不良网络环境下数据传输优化措施以及后续测试验证过程。 适合人群:从事工业自动化系统集成、物联网项目开发的技术人员,特别是那些希望提升跨协议数据交换能力的专业人士。 使用场景及目标:适用于需要在不同通信协议间建立高效稳定的数据通道的应用场合,比如制造业生产线监控、远程设备管理等。主要目的是克服传统有线网络限制,实现在不稳定无线网络条件下仍能保持良好性能的数据传输。 其他说明:文中提供了具体的代码片段帮助理解整个流程,并强调了实际部署过程中可能遇到的问题及解决方案。
基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档~ 基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档 基于C#实现的检测小说章节的重复、缺失、广告等功能+源码+项目文档,适合毕业设计、课程设计、项目开发。项目源码已经过严格测试,可以放心参考并在此基础上延申使用,详情见md文档
少儿编程scratch项目源代码文件案例素材-火柴人终极之战.zip