`
xinyangwjb
  • 浏览: 81581 次
  • 性别: Icon_minigender_1
  • 来自: 信阳
社区版块
存档分类
最新评论

solr学习一(一大堆的学习资料)

 
阅读更多

这篇博客含有海量资料,学习solr必备字典
大概看完solr就基本上手了。
solr原味资料:http://wiki.apache.org/solr/FrontPage

    http://wiki.apache.org/solr/QueryParametersIndex
    http://wiki.apache.org/solr/SchemaXml
    http://wiki.apache.org/solr/CoreAdmin
    http://wiki.apache.org/solr/ExtractingRequestHandler
    http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters
    http://wiki.apache.org/solr/LanguageAnalysis
    http://wiki.apache.org/solr/DataImportHandler#Overview
    http://wiki.apache.org/solr/Solrj
    http://wiki.apache.org/solr/SolrQuerySyntax

solr咀嚼资料一(如联接消失可下载附件):http://clayz.iteye.com/blog/240366
solr咀嚼资料二:http://www.ibm.com/developerworks/cn/java/j-solr1/#basics
solr咀嚼资料三:http://www.ibm.com/developerworks/cn/java/j-solr-update/index.html
solr咀嚼资料四(多核(MultiCore)配置  ):http://aixiangct.blog.163.com/blog/static/9152246120111128114423633/
slor咀嚼资料五(几个solr高手):http://blog.csdn.net/aidayei/article/category/829139
http://blog.chenlb.com/category/solr-search
http://lianj-lee.iteye.com/category/71985
http://passover.blog.51cto.com/2431658/568972
http://wutaoo.iteye.com/category/58704?show_full=true
http://blognojava.iteye.com/blog/1187996

DataImportHandler的译文:http://mxsfengg.blog.163.com/blog/static/26370218200810250524813/

讲的较没用,但很深的:http://liuxinglanyue.iteye.com/category/133220

solr源码分析:
http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

solr讲的不错的solr高级配置:http://hi.baidu.com/mutourenoo/blog/item/63f430359ac23282a71e1269.html

solr.solr.home的配置和理解:
配置的是程序主目录,程序根据这个目录查找源文件,如System.setProperty("solr.solr.home", "./");源码分析中有介绍:http://www.cnblogs.com/mandela/archive/2011/05/10/2041753.html

在index页面在赋予下面多索引的链接。方法如下
<%
  org.apache.solr.core.CoreContainer cores = (org.apache.solr.core.CoreContainer)request.getAttribute("org.apache.solr.CoreContainer");
  if( cores != null
   && cores.getCores().size() > 0 // HACK! check that we have valid names...
   && cores.getCores().iterator().next().getName().length() != 0 ) {
    for( org.apache.solr.core.SolrCore core : cores.getCores() ) {%>
<a href="<%= core.getName() %>/admin/">Admin <%= core.getName() %></a><br/>
<% }} else { %>
<a href="admin/">Solr Admin</a>
<% } %>

建议建立了一个拷贝字段,将所有的全文字段复制到一个字段中,以便进行统一的检索:
<field name="all" type="text" indexed="true" stored="false" multiValued="true"/> 
并在拷贝字段结点处完成拷贝设置:
Xml代码 
<copyField source="name" dest="all"/> 
<copyField source="summary" dest="all"/>

defaultSearchField
可以将某个Field设置为defaultSearchField,当没有明确的查询Field的时候,来查询这个Filed,该Filed一般设置为multiValued,copyField多个Filed


Solr Multicore 是 solr 1.3 的新特性。其目的一个solr实例,可以有多个搜索应用。
在solr.xml中配置,如:

<?xml version="1.0" encoding="UTF-8" ?>   
    <solr persistent="false">     
      <cores adminPath="/admin/cores">   
        <core name="core0" instanceDir="core0" />   
        <core name="core1" instanceDir="core1" />   
      </cores>   
</solr>
instanceDir是solr.home,即core0,core1索引资源文件所在的路径
name是solr请求的路径,如http://localhost:8393/core0/admin/可进入core的admin页面,
solrj可以用http://localhost:8393/core0/..对该索引请求操作

ExtractingRequestHandler是文件提取,可用于word、pdf等文件提取
可参考http://xinyangwjb.iteye.com/admin/blogs/1405676

中文分词采用lucene自带的CjkAnalyzer分词:
http://lianj-lee.iteye.com/blog/519254
http://blog.csdn.net/cnhome/article/details/5543308
采用cjk有俩原因,一、我使用的solr的版本只有1.4.0,lucene的版本也只有2.9.1,自带的中文分析器只有cjk。
二、cjk不用引入外部的jar报和字典库,简单,快~~

UniqueKey的问题:
默认是有这个属性的,也可以没有,如果有UniqueKey,add的时候,会先看该UniqueKey是否存在,如果存在则覆盖,不存在则新增

对于DateField的查询:
日期格式的字段的查询很恶心,必须是UTC格式,并且效率低下,建议是先将date字段转化为int或者long再存入索引。http://wiki.apache.org/solr/SolrQuerySyntax

分享到:
评论

相关推荐

    SOLR的学习资料

    在这个“SOLR的学习资料”中,我们将深入探讨如何进行SOLR的环境搭建、以及如何执行基本的增删改查操作。 **一、SOLR环境搭建** 1. **系统要求**:SOLR可以在多种操作系统上运行,包括Windows、Linux和Mac OS。...

    solr学习资料

    【Solr 学习资料详解】 Solr 是一个基于 Apache Lucene 的全文搜索服务器,它为企业提供了高效、可扩展的搜索解决方案。Solr 不仅提供了丰富的查询语言,还优化了索引和搜索性能,使得在大型网站、电子商务平台等...

    solr的学习

    ### Solr 学习知识点详解 #### 一、Solr 概述 - **定义**:Solr 是 Apache 下的一个顶级开源项目,采用 Java 开发,它是基于 Lucene 的全文搜索服务器。Solr 可以独立运行在 Jetty、Tomcat 等 Servlet 容器中。 -...

    solr学习入门教程

    ### Solr学习入门教程知识点详解 ...无论是用于网站搜索、文档检索还是大数据分析,Solr都是一个值得深入学习和掌握的工具。通过理解其架构、配置和优化方法,可以充分发挥Solr在搜索领域的潜力。

    solr 学习笔记

    solr 学习笔记主要涵盖了 Solr 的基本安装与配置,以及 Solr 服务器复制的配置,这些都是初学者需要掌握的基础知识。 Solr 是一款基于 Lucene 的全文搜索引擎,广泛应用于大数据检索和文本分析。在安装 Solr 时,...

    solr学习笔记

    ### Solr 学习笔记:关键命令使用说明 Solr 是一个开源的、高性能的全文检索引擎,基于 Java 开发,常被用于大型网站的搜索系统。本文将围绕给定内容中的关键命令进行详细的解析,主要包括 Solr 的启动、集群管理、...

    Solr入门教程-solr学习入门经典教程

    solr学习入门经典教程,赶紧学习吧,从solr的搭建讲起,中文分词器的配置

    Solr学习笔记。。

    Solr 是一个开源的全文搜索服务器,由Apache Lucene项目维护。它提供了高效、可扩展的搜索和分析功能,常用于大数据量的全文检索、数据分析和分布式搜索应用。本篇文章将详细探讨Solr的安装运行、添加分词器以及配置...

    solr资料以及问题汇总

    这个压缩包包含了一系列与Solr相关的资料和问题解决方案,对于开发者来说是一份宝贵的资源集合。 首先,"eContact+V3.5(3.5.7.4Q1)Solr檢索附件需求分析書V1.0-ZhaoHaiming20100415.docx"文件可能是关于一个特定...

    solr学习文档简介1

    Solr 学习文档简介 Solr 是 Apache 下的一个顶级开源项目,采用 Java 开发,是基于 Lucene 的全文搜索服务。Solr 可以独立运行在 Jetty、Tomcat 等这些 Servlet 容器中。Solr 提供了一个管理界面,通过管理界面可以...

    Solr学习笔记.doc

    Solr学习笔记 Solr 是一种基于 Lucene 的搜索服务器,可以满足企业对搜索解决方案的需求。它支持层面搜索、命中醒目显示和多种输出格式,易于安装和配置,並且附带了一个基于 HTTP 的管理界面。 Solr 的主要特点...

    SOLR-7学习2020.docx

    Solr 是一个强大的开源全文搜索引擎,它建立在 Java 开发的 Lucene 库之上,提供了更高级的企业级功能。在早期版本中,如 Solr 4 及之前,Solr 需要依赖像 Tomcat 这样的 web 容器来运行。然而,自 Solr 5 开始,它...

    Solr学习总结配置方法

    【Solr学习总结配置方法】 Solr是一款基于Apache Lucene的全文检索服务器,它提供了分布式、可扩展且高度可用的搜索和分析能力。Solr的主要特点是简化了索引创建和查询服务,使得开发者只需编写少量代码即可实现...

    Solr 学习笔记(五)-Solr扩展之分布式索引实例

    在本篇Solr学习笔记中,我们将探讨Solr的分布式索引功能,这对于处理大量数据和实现高可用性至关重要。Solr的分布式索引能力允许我们跨越多个节点分布和处理索引过程,从而提高索引速度和查询性能。在实际应用中,这...

Global site tag (gtag.js) - Google Analytics