最新文章列表

solr4.3的入门配置

  solr4.3的入门配置   目前阿帕奇官方仅推荐2个比较稳定的版本一个是4.3的版本,一个3.6的版本    3.6的版本没有用过,所以在此无涉及,下面就来说说solr4.3的入门配置    solr4.3与solr4.2最大的区别就在与solr4.3的日志模块与核心模块分离出来了    所以在进行安装配置时需要另行配置,其他的步骤基本与solr4.2的相同      准备环境tomcat ...
weitao1026 评论(0) 有556人浏览 2016-11-02 13:41

solr检索建议的功能

比较详细的介绍了拼写检查的功能,本篇笔者就来说一下检索建议的功能,可能好多才学的solr的人,都容易把二者搞混,误以为他们是同一个东西,其实不然,他们的侧重点,还是不同的,拼写检查就是用来检查用户输入的检索内容是否存在,如果不存在则,给它提示出相近,或相似的内容,而检索建议则是用户输入某个检索条件后,会立刻友好的给出一系列提示内容,并推荐首个出现的相似的词,作为推荐词。如果这个条件想关的东西一个 ...
weitao1026 评论(0) 有806人浏览 2016-11-02 13:41

solr作为一种开源的搜索服务器

拼写检查功能,能在搜索时,提供一个较好用户体验,所以,主流的搜索引擎都有这个功能。在这之前,笔者先简单的说一下什么是拼写检查,其实很 ...
weitao1026 评论(0) 有612人浏览 2016-11-02 13:39

solr中文分词的种类

上一篇讲了使用solr4.3自带的smartcn进行中文分词,这一篇说一下,怎么使用IK进行分词, 在这之前先对中文分词的种类介绍一下,目前的中文分词主要有两种 1,基于中科院ICTCLAS的隐式马尔科夫hhmm算法的中文分词器,例如smartcn等。(不支持自定义扩展词库) 2,基于正向迭代最细粒度切分算法(正向最大匹配并且最细分词)例如IK,庖丁等(支持自定义扩展词库) 安装分词前,可以去h ...
weitao1026 评论(0) 有519人浏览 2016-11-02 13:39

solr4.3默认的分词器

solr4.3默认的分词器是一元分词器,这个本来就是对英文进行分词的,英文大部分就是典型的根据空格进行分词,而中文如果按照这个规则,那么显然是要有很多的冗余词被分出来,一些没有用的虚词,数词,都会被分出来,影响效率不说,关键是分词效果不好,所以可以利用solr的同步发行包smartcn进行中文切词,smartcn的分词准确率不错,但就是不能自己定义新的词库,不过smartcn是跟solr同步的, ...
weitao1026 评论(0) 有601人浏览 2016-11-02 13:38

solr增量索引配置

solr增量索引配置 1.在进行增量索引前,首先要弄懂几个必要的属性,以及数据库建表事项,和dataimporter.properties                    data-config.xml里面的数据   <!--  transformer 格式转化:HTMLStripTransformer 索引中忽略HTML标签   --->  <!--  query:查询 ...
weitao1026 评论(0) 有751人浏览 2016-11-01 18:49

solr从数据库导入数据到索引中

solr从数据库导入数据到索引中 准备工作需要从solr4.2中C:\Users\cuichao\Desktop\solr\solr-4.2.1\dist目录下 把solr-dataimporthandler-4.2.1.jar包拷到D:\tomcat6\apache-tomcat-6.0.36.0\webapps\solr\WEB-INF\lib目录下 第一步,需要在solrconfig.x ...
weitao1026 评论(0) 有335人浏览 2016-11-01 17:57

web项目整合solr服务实现全文检索

  Solr是一个高性能,采用Java5开发,Solr基于Lucene的全文搜索服务器。   SolrJ是Apache提供的solr服务客服端工具 <dependency> <groupId>org.apache.solr</groupId> <artifactId>solr-solrj</artifactId&g ...
LoveLZY 评论(0) 有5602人浏览 2016-02-26 14:24

Hbase+Solr实现二级索引提供高效查询

接着上一篇介绍协处理器的文章http://qindongliang.iteye.com/blog/2277145,本篇我们来实战一个例子,看下如何使用协处理来给Hbase建立二级索引。 github地址:h ...
qindongliang1922 评论(0) 有7149人浏览 2016-02-18 18:28

SolrCloud5.4.1集群实战(一)

古时候,人们用一头牛拉不动一个耕地的犁时,不会去找个比这头牛更大的牛,而是会直接使用两个牛一起参与耕地。在分布式计算中,道理同样如此 ...
qindongliang1922 评论(0) 有3939人浏览 2016-02-06 10:06

Solr DocValues详解

什么是docValues? docValues是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的。 为什么要使用docValues? 这种形式比老版本中利用fieldCache来实现正排查找更加高效,更加节省内存。倒排索引将字段内存切分成一个term列表,每个term都对应着一个docid列表,这样一种结构使得查询 ...
mozhenghua 评论(0) 有6909人浏览 2016-02-05 13:40

基于Solr的多表join查询加速方法

前言 DT时代对平台或商家来说最有价值的就是数据了,在大数据时代数据呈现出数据量大,数据的维度多的特点,用户会使用多维度随意组合条件快速 ...
mozhenghua 评论(8) 有17596人浏览 2016-02-01 17:47

如何使用Spark大规模并行构建索引

使用Spark构建索引非常简单,因为spark提供了更高级的抽象rdd分布式弹性数据集,相比以前的使用Hadoop的MapReduce来构建大规模索引,Spark具有更灵活的api操作,性能更高,语法更简洁等一系列优点。 先看下,整体的拓扑图: 然后,再来看下,使用scala写的spark程序: package com.easy.build.index import jav ...
qindongliang1922 评论(0) 有2763人浏览 2016-02-01 12:54

Solr facet rage 查询

  需求是在按照某一个时间字段统计在一个时间区间中,以天为单位统计时间单位内的记录条数:   使用的Solr file type是:org.apache.solr.schema.TrieDateField   查询url是:     http://10.1.7.41:8983/solr/search4totalpay_shard1_replica1/select?        fl ...
mozhenghua 评论(0) 有1499人浏览 2016-01-19 18:44

Lucene4.6+Solr4.6+Heritrix1.14+S2SH实战开发垂直搜索引擎视频教程

百度网盘下载: http://pan.baidu.com/s/1bowbZLt  密码:u6tx 课程目录: 00.说在前面的话 01.heritrix环境搭建 02.如何进行主题抓取 03.heritrix优化 04.解析html网页 05 ...
hiopamd 评论(2) 有1295人浏览 2016-01-15 15:34

solr5.2..1中关于velocity搜索界面的部分配置

确定分面字段。 参考文档:\ solr-5.2.1\example\files\README.txt  的内容在Ubuntu平台操作, 得到 solr-5.2.1/server/solr/files/conf/velocity 文件夹 复制到 core或collection中的conf文件夹中。 修改solrconfig.xml文件。配置velocity writer 修改参考:solr-5.2.1 ...
feng_tai_jun 评论(0) 有1409人浏览 2016-01-11 19:34

中文分词mmseg4j+solr 5.3.1配置

基础环境: solr 5.3.1 mmseg4j-solr-2.3.0.jar mmseg4j-core-1.10.0.jar CentOS release 6.2 (Final) java version "1.7.0_71" jar添加: 位置:solr-5.3.1/server/solr-webapp/webapp/WEB-INF/lib 配置: 在schema.xml中 ...
yiduwangkai 评论(0) 有2251人浏览 2016-01-10 14:32

Caused by: org.apache.solr.common.SolrException: Invalid UUID String: '1'

问题:引用Caused by: org.apache.solr.common.SolrException: Invalid UUID String: '1' 参考:https://issues.apache.org/jira/browse/SOLR-3398 当使用 <fieldType name="uuid" class="solr.UUIDField&qu ...
feng_tai_jun 评论(0) 有2352人浏览 2016-01-06 16:01

solr5 配置 与 创建core

1. 准备安装包(保证tomat能正常启动)    solr5.0    tomcat-7.0.41    JDK6   2 配置部署solr   2.1 启动tomcat   2.2 将solr/server/webapps/solr.war  拷贝到tomcat的webapps下。tomat会自动解压发布。
onlyor 评论(0) 有3451人浏览 2015-12-31 09:49

最近博客热门TAG

应用服务器(43285) Spring(40811) Hibernate(33329) Tomcat(28344) 框架(27200) 设计模式(24055) Servlet(23313) Struts(22804) Bean(22194) 企业应用(18268) thread(15825) 多线程(14800) SUN(11436) 虚拟机(11382) Cache(11314) Security(8001) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics