- 浏览: 2654527 次
- 来自: 杭州
文章分类
- 全部博客 (1188)
- webwork (4)
- 网摘 (18)
- java (103)
- hibernate (1)
- Linux (85)
- 职业发展 (1)
- activeMQ (2)
- netty (14)
- svn (1)
- webx3 (12)
- mysql (81)
- css (1)
- HTML (6)
- apache (3)
- 测试 (2)
- javascript (1)
- 储存 (1)
- jvm (5)
- code (13)
- 多线程 (12)
- Spring (18)
- webxs (2)
- python (119)
- duitang (0)
- mongo (3)
- nosql (4)
- tomcat (4)
- memcached (20)
- 算法 (28)
- django (28)
- shell (1)
- 工作总结 (5)
- solr (42)
- beansdb (6)
- nginx (3)
- 性能 (30)
- 数据推荐 (1)
- maven (8)
- tonado (1)
- uwsgi (5)
- hessian (4)
- ibatis (3)
- Security (2)
- HTPP (1)
- gevent (6)
- 读书笔记 (1)
- Maxent (2)
- mogo (0)
- thread (3)
- 架构 (5)
- NIO (5)
- 正则 (1)
- lucene (5)
- feed (4)
- redis (17)
- TCP (6)
- test (0)
- python,code (1)
- PIL (3)
- guava (2)
- jython (4)
- httpclient (2)
- cache (3)
- signal (1)
- dubbo (7)
- HTTP (4)
- json (3)
- java socket (1)
- io (2)
- socket (22)
- hash (2)
- Cassandra (1)
- 分布式文件系统 (5)
- Dynamo (2)
- gc (8)
- scp (1)
- rsync (1)
- mecached (0)
- mongoDB (29)
- Thrift (1)
- scribe (2)
- 服务化 (3)
- 问题 (83)
- mat (1)
- classloader (2)
- javaBean (1)
- 文档集合 (27)
- 消息队列 (3)
- nginx,文档集合 (1)
- dboss (12)
- libevent (1)
- 读书 (0)
- 数学 (3)
- 流程 (0)
- HBase (34)
- 自动化测试 (1)
- ubuntu (2)
- 并发 (1)
- sping (1)
- 图形 (1)
- freemarker (1)
- jdbc (3)
- dbcp (0)
- sharding (1)
- 性能测试 (1)
- 设计模式 (2)
- unicode (1)
- OceanBase (3)
- jmagick (1)
- gunicorn (1)
- url (1)
- form (1)
- 安全 (2)
- nlp (8)
- libmemcached (1)
- 规则引擎 (1)
- awk (2)
- 服务器 (1)
- snmpd (1)
- btrace (1)
- 代码 (1)
- cygwin (1)
- mahout (3)
- 电子书 (1)
- 机器学习 (5)
- 数据挖掘 (1)
- nltk (6)
- pool (1)
- log4j (2)
- 总结 (11)
- c++ (1)
- java源代码 (1)
- ocr (1)
- 基础算法 (3)
- SA (1)
- 笔记 (1)
- ml (4)
- zokeeper (0)
- jms (1)
- zookeeper (5)
- zkclient (1)
- hadoop (13)
- mq (2)
- git (9)
- 问题,io (1)
- storm (11)
- zk (1)
- 性能优化 (2)
- example (1)
- tmux (1)
- 环境 (2)
- kyro (1)
- 日志系统 (3)
- hdfs (2)
- python_socket (2)
- date (2)
- elasticsearch (1)
- jetty (1)
- 树 (1)
- 汽车 (1)
- mdrill (1)
- 车 (1)
- 日志 (1)
- web (1)
- 编译原理 (1)
- 信息检索 (1)
- 性能,linux (1)
- spam (1)
- 序列化 (1)
- fabric (2)
- guice (1)
- disruptor (1)
- executor (1)
- logback (2)
- 开源 (1)
- 设计 (1)
- 监控 (3)
- english (1)
- 问题记录 (1)
- Bitmap (1)
- 云计算 (1)
- 问题排查 (1)
- highchat (1)
- mac (3)
- docker (1)
- jdk (1)
- 表达式 (1)
- 网络 (1)
- 时间管理 (1)
- 时间序列 (1)
- OLAP (1)
- Big Table (0)
- sql (1)
- kafka (1)
- md5 (1)
- springboot (1)
- spring security (1)
- Spring Boot (3)
- mybatis (1)
- java8 (1)
- 分布式事务 (1)
- 限流 (1)
- Shadowsocks (0)
- 2018 (1)
- 服务治理 (1)
- 设计原则 (1)
- log (0)
- perftools (1)
最新评论
-
siphlina:
课程——基于Python数据分析与机器学习案例实战教程分享网盘 ...
Python机器学习库 -
san_yun:
leibnitz 写道hi,我想知道,无论在92还是94版本, ...
hbase的行锁与多版本并发控制(MVCC) -
leibnitz:
hi,我想知道,无论在92还是94版本,更新时(如Puts)都 ...
hbase的行锁与多版本并发控制(MVCC) -
107x:
不错,谢谢!
Latent Semantic Analysis(LSA/ LSI)算法简介 -
107x:
不错,谢谢!
Python机器学习库
作用
函数查询的作用,是影响计算score的算法,并不替换,只是影响。普通的计算score的方法是lucene本身的算法。
描述如下:
A function query allows you to introduce a component of the score that is computed,
based on a mathematical expression of your choice involving indexed field value(s).
This is not a replacement for Lucene's scoring algorithm, but it basically adds to the
existing score.
可见 函数查询 这个名字并不好,如 《Solr 1.4 Enterprise Search Server》中所述:
A bad name for this feature
The name of this feature is poor as it does not reflect what it does.
Perhaps Scoring Function
or even Score Query
might have been
bette
r. The reason for the name Function Query undoubtedly stems
from the manner in which the feature is implemented. It is implemented
as a Lucene Query type, albeit a very strange one that matches all of the
documents but scores them differently.
本质:
增加一个查询字段,值为函数计算所得。
可以简单这么理解 score += 函数计算结果
本来score是lucene根据字段的查询得到的,比如查询字符串 comments:套餐 lucene根据具体索引情况计算得到score值。
现在模拟一个字段,规定叫做_val_,这个字段的值就是跟随的函数计算的结果。
例子 comments:套餐 && _val_:"div(age,status)"
用法
用法wiki里有好几种,严格来说4种,详细请看wiki。
现在的刚刚发布solr3.1(同步了lucene的版本),这些功能我并没有用过。但1.4中的有些用法有bug。
可以的用法:
q=comments:套餐 && _val_:"div(age,status)"
注意函数就是一个表达式,所以函数也是可以嵌套的~
其他的,不再重复solr的wiki中的内容,仅仅贴出链接。
函数查询的中文翻译版(不太全):http://www.iteye.com/topic/352191
函数查询的wiki版(全而新) :http://wiki.apache.org/solr/FunctionQuery#Using_FunctionQuery
一个好例子,仔细看哦~~ :http://www.ibm.com/developerworks/cn/java/j-spatial/
发表评论
-
三种solr提交(commit)索引的方式
2014-03-01 13:40 20945三种solr提交索引的 ... -
solr build索引性能
2014-03-01 13:26 1544测试代码 package mytest; impo ... -
Solr性能优化之filterCache
2014-02-27 10:48 950原文:Solr性能优化之filterCache 什么是f ... -
SolrCore查询过程源码分析
2014-02-12 15:37 1252一.环境启动代码 SolrResourceLoader. ... -
通过设置SolrInputDocument 的boost来改变文档评分
2014-01-31 23:18 1549solr通过关键字查询后的文档得分最后要乘以这个boost因 ... -
Solr 使用 Log4j
2014-01-25 21:31 2401原文出处:http://blog.chenlb.com/20 ... -
solr基本概念
2014-01-25 20:49 1409原文:http://www.solrtutorial.com ... -
solr load比较高
2013-12-02 09:50 1069最近solr的load比较高,通过jstack查看: 写 ... -
Solr索引放入内存
2013-08-28 11:45 10026在一次技术群中,中听到一位sina的架构师,他们是采用基于l ... -
solr build索引遇到控制字符的错误
2013-08-23 15:12 627今天build solr 索引遇到如下错误: 发现提 ... -
solr 更新index的最佳实践
2013-08-22 15:24 1018其中重要一点是,solr不运行并发commit。 懒得翻 ... -
Scaling Solr(Solr的扩展)
2013-08-21 20:55 710Solr 的扩展 (Scaling) 当你的索 ... -
Lucene Scoring 评分机制
2013-08-21 20:52 724Lucene 评分体系/机制 ... -
solr build index例子
2013-08-20 14:24 871p = PeopleDO({'userid':101,'s ... -
solr build索引时commit与optimize的概念
2013-08-20 14:22 1944大家都知道,solr在提交索引的时候有commit和opt ... -
solr in action
2013-08-20 13:56 1238solr in action电子书 -
solr java客户端build索引
2012-12-17 17:08 1095package com.duitang.views.tes ... -
Solr搜索的排序打分规则
2012-11-20 17:48 2459使用Solr搭建搜索引擎很容易,但是如何制定合理的打分规则(b ... -
Solrj
2012-11-20 14:17 997solr 的java客户端可比python复杂一些,贴点代码: ... -
solr cache使用和介绍
2012-07-23 18:49 0原文:http://wiki.apache.org ...
相关推荐
2. **Solr**:拥有更强大的查询优化能力,支持更复杂的查询表达式。SolrCloud 提供了分布式处理,同时支持多种数据类型,包括XML、JSON、CSV等。 **四、社区支持** 1. **Elasticsearch**:作为相对较新的技术,...
在搭建Solr环境时,`solr_Tomcat_lib`包扮演了关键角色,因为它是Solr在Tomcat容器中运行所需的库文件集合。 首先,让我们详细了解`lib`目录。这个目录通常包含Solr运行所必需的各种JAR文件,这些文件主要分为以下...
Solr是一个高性能,采用Java开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一...
总之,"solr-config_solrj-demo.rar_DEMO_solr_solr的j"这个DEMO是一个全面了解和实践Solr配置及SolrJ使用的宝贵资源,它将引导你逐步掌握如何在实际项目中有效地运用Solr进行全文检索和数据分析。通过深入学习和...
ikanalyzer 对中文字符进行分词,确保了中文文本在索引和查询时的准确性和效率。 ikanalyzer-solr8.4.0 包含了与 Solr 8.4.0 版本兼容的 ikanalyzer 配置和类库。在使用这个包时,我们需要将其正确地集成到 Solr 的...
solr_3_2_0-server-8.11.2-1.el7.noarch
solr_3_2_0-doc-8.11.2-1.el7.noarch
复制`tomcat7_ser1`和`solr_home_1`,分别命名为`tomcat7_ser2`、`tomcat7_ser3`及`solr_home_2`、`solr_home_3`。 2. 修改各`tomcat7_ser*`的`server.xml`,配置对应的`solrhome*`和端口信息,如: - `tomcat7_...
在每个Solr节点上,我们需要配置solr.in.sh(在Unix/Linux系统中)或solr.in.cmd(在Windows系统中),设置`SOLR_HOME`、`JAVA_OPTS`等环境变量,并指定ZooKeeper集群的位置。 3. **启动SolrCloud**:启动每个Solr...
在这个"solr_5.0_tomcat7_IKAnalyzer中文分词安装及demo"的压缩包中,你将找到如何在Solr 5.0中集成IKAnalyzer并进行演示的详细步骤。 首先,我们需要了解Solr与IKAnalyzer的集成过程: 1. **下载和解压**:获取...
5. **自定义插件**:Solr 允许开发人员编写自定义插件,如查询解析器、过滤器、排序函数等,以满足特定需求。 6. **分布式搜索**:通过配置多个 Solr 核心,可以实现分布式搜索,处理大规模数据并提高性能。 在...
9. **性能优化**:Solr 1.4.0版本在索引构建和查询速度上都有一定的优化,通过缓存机制和查询优化策略来提升性能。 10. **国际化与本地化**:Solr支持多语言处理,包括对非拉丁字符集的支持,如中文、日文等,这...
本书由David Smiley和Eric Pugh共同编写,旨在帮助读者掌握如何利用Solr增强搜索体验,包括面向导航的分面搜索(faceted navigation)、结果高亮(result highlighting)、模糊查询(fuzzy queries)、排名评分(ranked ...
读者还将学习如何使用 Solr 的查询解析器、插件和扩展来增强搜索功能,并通过实际案例学习如何在应用程序中整合 Solr,解决常见的搜索相关问题。 除了技术细节和配置指导,《Apache Solr 4 Cookbook》也探讨了安全...
**总结** Ik Analyzer是Java世界中的一个强大中文分词工具,尤其在与Solr集成时,能显著提高搜索效率和准确性。"ik-analyzer-solr-master"版本专门针对Solr进行了优化,而"Pocket7ce"可能指的是一个定制版或分支,...
1. **索引**:索引是Solr处理数据的基础,它是对文档进行预处理后的结果,用于快速查询。Solr使用倒排索引技术,将文档中的每个词映射到包含该词的文档列表,大大提高了搜索速度。 2. **Core**:在Solr中,Core是一...
solr_lxml_示例演示 solr 和 lxml 的 python 代码支持:Mac osx。 Python2.7 & python3.2 lxml 和 yaml 只为 Python2.7 & python3.2 编译示例可执行代码位于:/solr_lxml_Example/server/core 当任何应用程序启动时...
Solr in Action by Trey Grainger , Timothy Potter Book Description Publication Date: April 5, 2014 | ISBN-10: 1617291021 | ISBN-13: 978-1617291029 | Edition: 1 Summary Solr in Action is a ...
Ambari+Bigtop 一站式编译和部署解决方案 https://gitee.com/tt-bigdata/ambari-env
1. **Solr的基本概念**:了解什么是索引、查询处理、分词器、过滤器、评分机制等核心概念,它们是构建Solr搜索系统的基础。 2. **安装与部署**:Solr的下载、解压、启动和停止过程,以及如何配置Solr服务器,包括...