`
lies_joker
  • 浏览: 40503 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

新版 搜索 日志记录

阅读更多
在本人工作期间,会不断更新优化公司的搜索!

2014年8月4日,搜索BUG修复:
java.lang.UnsupportedOperationException

2014年8月1日,搜索BUG修复:

修复ansj索引分词排序错误导致快速高亮出错的问题

2014年7月29日,搜索BUG修复:

带有html标签的字段高亮bug的修改

分词接口向低版本的solr开发的接口兼容

拼写纠错的加入

2014年7月18日,搜索新特性:

zookeeper和solrcloud的加入,令人兴奋!

solr索引core新的创建方式,不再需要重启solr服务

solr多机器数据的同步和更新

更快的搜索响应速度

搜索性能自动负载,为将来可能扩展搜索机器预留接口

敏感词搜索优化准确度




2014年7月11日,新版搜索新特性:

solr版本升级到solr4.8.1

中文分词器改用ansj,开源,简洁,强大,无害

词库兼顾任意编码格式,不怕乱码

分词器和分词词库分离,降低更新分词器版本难度

分词器配置统一在library.properties中,在solr/WEB-INF/classes目录下

人名智能分词

优良的停用词库

更好用的高亮

schema.xml配置精简

common-lr的加入,小工具多多

预留搜索建议提示接口

2014年12月22日,新版搜索新特性:

中文分词器加入IKanalyzer和ansj_seg并列,针对不同的搜索用不同的分词器,目前875和shengyijie采用IKanalyzer分词器

IKanalyzer二次开发,更加简便的用户词库导入,无需刷新和配置即可使用

IKanalyzer同样的分词器和分词词库分离,IKanalyzer分词器缩小到52KB

升级后的common-lr,优秀易懂的日志输出

solr4.8.1和智能化的IKanalyzer分词器的结合

分享到:
评论

相关推荐

    搜狗五百万用户搜索日志记录

    这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个搜狗搜索的日志记录,总共有五百万条用户的搜索信息,可以为练习大数据的数据源,这是网上找的一个...

    搜狗搜索日志分析系统

    **搜狗搜索日志分析系统** 搜狗搜索日志分析系统是一种用于处理和解析大量搜索引擎日志数据的工具,旨在帮助我们理解用户行为、优化搜索引擎性能以及改进搜索算法。在这个系统中,通常会使用大数据处理框架如Hadoop...

    vc++ c++ mfc 日志 log 记录

    日志记录(log recording)是软件开发中的一个重要环节,它有助于调试、监控和故障排查。本篇文章将深入探讨如何在VC++、C++和MFC环境下实现日志功能。 1. **日志的基本概念** - 日志是记录程序运行过程中的事件、...

    搜索引擎蜘蛛日志记录查看器

    【搜索引擎蜘蛛日志记录查看器】是一款针对ASP环境下的网站管理员设计的工具,主要用于分析和解读搜索引擎蜘蛛(如Googlebot、Bingbot、Sogou Spider等)在网站上的活动情况。这款工具能够帮助管理员更好地理解网站...

    日志记录工具

    在IT行业中,日志记录工具是开发者和系统管理员不可或缺的辅助工具,它们用于跟踪和记录应用程序、服务或系统的运行情况,以便在出现问题时进行故障排查和性能优化。本篇文章将详细探讨日志记录工具的重要性和功能,...

    ASP.NET(C#)日志记录系统

    ASP.NET(C#)日志记录系统是Web应用程序中一个至关重要的组成部分,主要用于追踪和记录程序运行过程中的事件、错误和用户行为。这个系统在登录模块的基础上增加了日志记录功能,使得开发者可以更全面地了解应用的运行...

    非常简单实用的日志记录软件,按天存放为txt文本

    在IT行业中,日志记录是不可或缺的一个环节,它对于软件的调试、监控和问题排查具有重要作用。"非常简单实用的日志记录软件,按天存放为txt文本" 是一种常见的日志管理方式,它便于我们组织和查找日志信息。下面我们...

    Go-golang简单的日志记录器。日志可输出到控制台文件或ElasticSearch。简单易于使用

    在Golang中,日志记录是程序开发中的一个重要组成部分,它可以帮助开发者跟踪代码运行状态,定位错误,并在必要时进行调试。"Go-golang简单的日志记录器"是一个旨在简化日志管理的库,它提供了将日志输出到控制台、...

    日志myLogApp日志记录项目

    在IT行业中,日志记录是软件开发不可或缺的一部分,它对于问题排查、系统监控以及性能优化起着至关重要的作用。在“日志myLogApp日志记录项目”中,我们可以深入探讨Java平台上的日志管理实践。 1. **日志概念与...

    日志管理+搜索C#demo

    本示例项目“日志管理+搜索C# demo”提供了一个简单但实用的日志处理应用,它使用C#编程语言实现了读取日志文件、在界面展示以及搜索关键字的功能,非常适合C#初学者学习。 首先,我们要理解C#的基本语法和文件操作...

    搜索引擎日志分析工具

    IIS日志文件记录了所有与服务器交互的活动,包括搜索引擎爬虫的访问记录。这些记录包含了请求的URL、HTTP状态码、用户代理(揭示了访问者身份,例如百度爬虫、Googlebot)、时间戳等信息。通过对这些数据的分析,...

    多线程调试日志记录类

    在软件开发过程中,尤其是涉及到多线程编程时,日志记录是至关重要的工具。它能够帮助开发者追踪程序的运行状态,定位错误和异常,从而提高调试效率。标题提到的"多线程调试日志记录类"是专为解决这类问题而设计的。...

    电子日志 方便记录信息

    电子日志,作为一种高效的信息记录工具,已经成为现代人日常工作中不可或缺的一部分。它以其便捷性、易用性和可搜索性,极大地提升了信息管理的效率。在本文中,我们将深入探讨电子日志的重要特性、优势以及如何利用...

    蜘蛛日志在线分析工具源码 快速分析搜索引擎网络爬虫抓取记录

    蜘蛛日志在线分析工具是一款开源的工具,可用于快速分析网站访问日志中搜索引擎网络爬虫的抓取记录。如果你的服务器运行在linux宝塔面板环境下,你只需要登录宝塔面板的linux控制面板,在左侧导航栏中点击”文件”,...

    应用程序日志记录log.zip

    在IT行业中,日志记录是软件开发和系统运维不可或缺的一部分。"应用程序日志记录log.zip"这个文件集合,显然包含了应用程序在运行时产生的各种日志信息。这些信息对于开发者、测试人员以及系统管理员来说,都是宝贵...

    asp.net 网站异常日志记录,全局配置即可实现全部错误的记录,可管理查看错误

    在ASP.NET中,异常处理和日志记录是至关重要的部分,它们可以帮助开发者追踪和解决程序运行时的问题,确保系统的稳定性和可靠性。下面我们将深入探讨如何在ASP.NET中实现全局的异常日志记录,以及如何管理和查看这些...

    ASP.NET中记录错误日志方法

    本文将深入探讨如何在C# .NET环境下有效地实现错误日志记录。 首先,了解错误日志的基本概念。错误日志是程序运行过程中记录的异常信息,包括错误类型、发生时间、堆栈跟踪等,它为调试和性能优化提供了关键数据。...

    iis日志分析工具_网站日志分析器_蜘蛛访问记录查看器

    通过对这些爬虫的访问记录进行分析,网站管理员可以了解到哪些页面被搜索引擎频繁抓取,从而调整网页内容和结构,提高网站在搜索引擎中的排名。 日期查看功能允许用户根据特定的时间范围筛选和分析日志,这对于追踪...

    网站日志蜘蛛在线分析工具源码 日志可视化管理 快速分析搜索引擎网络爬虫抓取记录

    快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件目录中就能见到网站访问日志了, ps:经实测,Windows系统...

Global site tag (gtag.js) - Google Analytics