`
- 浏览:
41196 次
- 性别:
- 来自:
上海
-
最新评论
-
brada:
看这篇文章,不知道为啥作者不能做到起码的公正。举个例子哈: 2 ...
IKanalyzer、ansj_seg、jcseg三种中文分词器的实战较量
-
lies_joker:
monolithic 写道我这边用的是mmseg4j ,与最新 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
monolithic:
我这边用的是mmseg4j ,与最新的solr4.9结合,也挺 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
lies_joker:
东林碣石 写道我想问一下楼主,你们公司使用solr建的索引的规 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
-
东林碣石:
我想问一下楼主,你们公司使用solr建的索引的规模有多大?有几 ...
solr4.8的安装,配置,使用,搜索,推荐及看法
在本人工作期间,会不断更新优化公司的搜索!
2014年8月4日,搜索BUG修复:
java.lang.UnsupportedOperationException
2014年8月1日,搜索BUG修复:
修复ansj索引分词排序错误导致快速高亮出错的问题
2014年7月29日,搜索BUG修复:
带有html标签的字段高亮bug的修改
分词接口向低版本的solr开发的接口兼容
拼写纠错的加入
2014年7月18日,搜索新特性:
zookeeper和solrcloud的加入,令人兴奋!
solr索引core新的创建方式,不再需要重启solr服务
solr多机器数据的同步和更新
更快的搜索响应速度
搜索性能自动负载,为将来可能扩展搜索机器预留接口
敏感词搜索优化准确度
2014年7月11日,新版搜索新特性:
solr版本升级到solr4.8.1
中文分词器改用ansj,开源,简洁,强大,无害
词库兼顾任意编码格式,不怕乱码
分词器和分词词库分离,降低更新分词器版本难度
分词器配置统一在library.properties中,在solr/WEB-INF/classes目录下
人名智能分词
优良的停用词库
更好用的高亮
schema.xml配置精简
common-lr的加入,小工具多多
预留搜索建议提示接口
2014年12月22日,新版搜索新特性:
中文分词器加入IKanalyzer和ansj_seg并列,针对不同的搜索用不同的分词器,目前875和shengyijie采用IKanalyzer分词器
IKanalyzer二次开发,更加简便的用户词库导入,无需刷新和配置即可使用
IKanalyzer同样的分词器和分词词库分离,IKanalyzer分词器缩小到52KB
升级后的common-lr,优秀易懂的日志输出
solr4.8.1和智能化的IKanalyzer分词器的结合
分享到:
Global site tag (gtag.js) - Google Analytics
相关推荐
日志记录(log recording)是软件开发中的一个重要环节,它有助于调试、监控和故障排查。本篇文章将深入探讨如何在VC++、C++和MFC环境下实现日志功能。 1. **日志的基本概念** - 日志是记录程序运行过程中的事件、...
这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个...
**搜狗搜索日志分析系统** 搜狗搜索日志分析系统是一种用于处理和解析大量搜索引擎日志数据的工具,旨在帮助我们理解用户行为、优化搜索引擎性能以及改进搜索算法。在这个系统中,通常会使用大数据处理框架如Hadoop...
【搜索引擎蜘蛛日志记录查看器】是一款针对ASP环境下的网站管理员设计的工具,主要用于分析和解读搜索引擎蜘蛛(如Googlebot、Bingbot、Sogou Spider等)在网站上的活动情况。这款工具能够帮助管理员更好地理解网站...
在IT行业中,日志记录工具是开发者和系统管理员不可或缺的辅助工具,它们用于跟踪和记录应用程序、服务或系统的运行情况,以便在出现问题时进行故障排查和性能优化。本篇文章将详细探讨日志记录工具的重要性和功能,...
ASP.NET(C#)日志记录系统是Web应用程序中一个至关重要的组成部分,主要用于追踪和记录程序运行过程中的事件、错误和用户行为。这个系统在登录模块的基础上增加了日志记录功能,使得开发者可以更全面地了解应用的运行...
### Hive综合应用案例—用户搜索日志分析 #### 一、背景介绍 随着互联网技术的发展,用户搜索行为已经成为衡量网站或应用性能与用户体验的重要指标之一。通过对用户搜索日志进行深入分析,不仅可以揭示用户的搜索...
在IT行业中,日志记录是不可或缺的一个环节,它对于软件的调试、监控和问题排查具有重要作用。"非常简单实用的日志记录软件,按天存放为txt文本" 是一种常见的日志管理方式,它便于我们组织和查找日志信息。下面我们...
在Golang中,日志记录是程序开发中的一个重要组成部分,它可以帮助开发者跟踪代码运行状态,定位错误,并在必要时进行调试。"Go-golang简单的日志记录器"是一个旨在简化日志管理的库,它提供了将日志输出到控制台、...
对于大型系统或应用,日志文件可能会迅速增长到非常大的体积,这使得直接打开和搜索日志变得困难。"超大日志文件查看搜索工具"就是为了解决这个问题而设计的,它能有效地帮助用户高效地浏览和搜索这些海量的日志数据...
在IT行业中,日志记录是软件开发不可或缺的一部分,它对于问题排查、系统监控以及性能优化起着至关重要的作用。在“日志myLogApp日志记录项目”中,我们可以深入探讨Java平台上的日志管理实践。 1. **日志概念与...
本示例项目“日志管理+搜索C# demo”提供了一个简单但实用的日志处理应用,它使用C#编程语言实现了读取日志文件、在界面展示以及搜索关键字的功能,非常适合C#初学者学习。 首先,我们要理解C#的基本语法和文件操作...
IIS日志文件记录了所有与服务器交互的活动,包括搜索引擎爬虫的访问记录。这些记录包含了请求的URL、HTTP状态码、用户代理(揭示了访问者身份,例如百度爬虫、Googlebot)、时间戳等信息。通过对这些数据的分析,...
在软件开发过程中,尤其是涉及到多线程编程时,日志记录是至关重要的工具。它能够帮助开发者追踪程序的运行状态,定位错误和异常,从而提高调试效率。标题提到的"多线程调试日志记录类"是专为解决这类问题而设计的。...
蜘蛛日志在线分析工具是一款开源的工具,可用于快速分析网站访问日志中搜索引擎网络爬虫的抓取记录。如果你的服务器运行在linux宝塔面板环境下,你只需要登录宝塔面板的linux控制面板,在左侧导航栏中点击”文件”,...
电子日志,作为一种高效的信息记录工具,已经成为现代人日常工作中不可或缺的一部分。它以其便捷性、易用性和可搜索性,极大地提升了信息管理的效率。在本文中,我们将深入探讨电子日志的重要特性、优势以及如何利用...
在IT行业中,日志记录是软件开发和系统运维不可或缺的一部分。"应用程序日志记录log.zip"这个文件集合,显然包含了应用程序在运行时产生的各种日志信息。这些信息对于开发者、测试人员以及系统管理员来说,都是宝贵...
在ASP.NET中,异常处理和日志记录是至关重要的部分,它们可以帮助开发者追踪和解决程序运行时的问题,确保系统的稳定性和可靠性。下面我们将深入探讨如何在ASP.NET中实现全局的异常日志记录,以及如何管理和查看这些...
本文将深入探讨如何在C# .NET环境下有效地实现错误日志记录。 首先,了解错误日志的基本概念。错误日志是程序运行过程中记录的异常信息,包括错误类型、发生时间、堆栈跟踪等,它为调试和性能优化提供了关键数据。...