最新文章列表

为了实现在线库的复杂查询,你还在双写吗?

一、在线库不支持在线复杂查询 -------------- 做在线业务的开发者经常会碰到这样的难题:在线数据库上面运行稍微复杂点的查询,在线业务就挂了!不管是单机数据库如MySQL、PG,还是分布式数据库,HBase、MongoDB、Cassandra都有这个问题。下面,本文就以HBase为例对该问题进行说明,其他库原理类似。 HBase作为海量在线存储引擎,被广泛应用于推荐、风控、物联网、画像 ...
大涛学长 评论(0) 有358人浏览 2019-11-25 15:38

NLPIR汉语智能语义中文挖掘的基石

  目前,我国信息化程度不断提高,各类数据中心如雨后春笋般涌现。相应的,IT运维的数据量也成几何速度上升。一方面,运维人员的增长远远跟不 ...
ljrj12345 评论(0) 有18人浏览 2018-05-29 15:30

Elasticsearch关键词高亮检索案例分享

1.准备工作 参考文档《集成Elasticsearch Restful API案例》导入和配置es客户端 2.创建索引表和初始化数据 通过组件DocumentCRUD来创建索引表和初始化数据,DocumentCRUD组件实现本文不做重点介绍: /** * 创建索引表,并导入高亮检索功能需要的测试数据 */ public void initIndiceAndData(){ Do ...
yin_bp 评论(0) 有6286人浏览 2018-05-10 22:18

[转载] Java开发在线编辑Word同时实现全文检索

一、背景介绍     Word文档与日常办公密不可分,在实际应用中,当某一文档服务器中有很多Word文档,假如有成千上万个文档时,用户查找打开包含某些指定关键字的文档就变得很困难,一般情况下能想到的解决方案是使用服务器端的Apache poi技术将所有文档的文本获取后存储到数据库,然后打开文档时利用sql语句检索文档是否包含关键字来判断是否是打开文档。但是这种解决办法有很大的弊端,首先poi技术对 ...
18335864773 评论(0) 有1123人浏览 2018-04-28 14:27

Elasticsearch如何检索数据

我们都知道Elasticsearch是一个全文检索引擎,那么它是如何实现快速的检索呢? 传统的数据库给每个字段都存储成一个单个值,对于全文检索而言,这样的存储是低效的。举个例子,我有一个大文本字段,存到数据库里面只能是一个值,如果想要检索这个大文本字段里面的任何一个词,数据库如何实现? 只能通过like模糊查询来实现,先不说性能低,这对于一个搜索引擎是远远不够的。 针对上面数据库的不足,所以才出 ...
qindongliang1922 评论(0) 有1070人浏览 2018-03-14 20:11

NLPIR-Parser系统是文本智能语义深度挖掘的钥匙

  随着互联网时代的大发展,数据记录逐步脱离了纸笔的限制,人类发明了廉价的硅晶半导体所蕴藏的秘密,大量的数据可以按0或1的二进制方式存储半导体材料内,它们的存储能力如此巨大,成本如此低廉,以至于以往被轻易忽略的数据都能被忠实的保存下来。 与此同时,数据的概念也在进一步拓宽。传统的数据是指用数字或文字描述的内容,通称为结构化数据,而大数据时代涌现出了大量新型数据的、非结构化的数据。而正在发生的大数据变 ...
ljrj12345 评论(0) 有246人浏览 2018-03-14 14:56

Lucene全文检索引擎

    Lucene是apache软件基金会4 jakarta项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,但它不是一个完整的全文检索引擎,而是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引擎(英文与德文两种西方语言)。Lucene的目的是为软件开发人员提供一个简单易用的工具包,以方便的在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。 ...
1151461406 评论(0) 有707人浏览 2017-08-04 15:42

mysql索引总结

摘抄:http://blog.csdn.net/xluren/article/details/32746183 关于MySQL索引的好处,如果正确合理设计并且使用索引的mysql是一辆兰博基尼的话,那么没有设计和使用 ...
磊磊的博客 评论(0) 有447人浏览 2017-06-23 22:25

懒人改善生活之 - 数据入库实时转换

阅读原文请点击:http://click.aliyun.com/m/23939/ 摘要: 标签 PostgreSQL , ETL , 数据转换 , 实时转换 , 规则 , 触发器 背景 PostgreSQL是一个功能很强大的数据库,仅 ...
骑猪逛街666 评论(0) 有637人浏览 2017-06-23 11:08

自动建立正确索引(btree,hash,gin,gist,sp-gist,brin,bitmap...)的方法

阅读原文请点击;http://click.aliyun.com/m/23941/ 摘要: 标签 PostgreSQL , 索引接口 , 自动创建索引 , 自动选择索引接口 , (btree,hash,bitmap,gin,gist,sp-gist,brin,rum,bloom,zoomdb) 背景 PostgreSQL的索引接口是开放的,支持btree,hash,bitmap,gin,gist,s ...
骑猪逛街666 评论(0) 有863人浏览 2017-06-23 11:04

行为、审计日志_(实时索引/实时搜索)建模_-_最佳实践_2

http://click.aliyun.com/m/21904/ 摘要: 标签 PostgreSQL , ES , 搜索引擎 , 全文检索 , 日志分析 , 倒排索引 , 优化 , 分区 , 分片 , 审计日志 , 行为日志 , schemaless 背景 在很多系统中会记录用户的行为日志,行为日志包括浏览行为、社交行为、操作行为等。 标签 PostgreSQL , ES , 搜索引擎 , ...
骑猪逛街666 评论(0) 有725人浏览 2017-05-26 14:33

mysql索引详解(转)

什么是索引 转自:http://www.cnblogs.com/ggjucheng/archive/2012/11/04/2754128.html 索引用来快速地寻找那些具有特定值的记录,所有MySQL索引都以B-树的形式保存。 ...
eblddong 评论(0) 有477人浏览 2017-04-06 14:58

Elasticsearch是当今最流行的分布式搜索引擎

Elasticsearch是当今最流行的分布式搜索引擎,GitHub、 SalesforceIQ、Netflix等公司将其用于全文检索和分析应用。在Insight,我们用到了Elasticsearch的诸多不同功能,比如: 全文检索  比如找到与搜索词项(term)最相关的维基百科文章。 聚合  比如在广告网络中,可视化的搜索词项的竞价直方图。 地理空间A ...
weitao1026 评论(0) 有983人浏览 2016-09-30 15:13

数据库的全文搜索

这里说的数据库搜索不是指全文检索,如果是全文检索,针对非结构化数据,可以采用常用的全文检索软件提供的接口实现,比如lucence,sphinx等开源软件实现,设计到大数量的问题,不属于本文考虑的问题。 一般数据库系统中存储的都是结构化的数据,每个字段的数据量很小,针对这样的数据进行全文搜索,如果是单个表,可以穷举各个字段,获得各个字段大致是采用resultset.getDatabaseMetaD ...
weitao1026 评论(0) 有523人浏览 2016-09-29 14:25

项目开发

承接软件架构设计,方案设计,软件开发工作。软件类型包括:OA,大数据相关、全文检索或其他管理类系统。敬请@2914800013。
defenderhhhh 评论(0) 有337人浏览 2016-09-27 16:24

SolrCloud6.1.0之SQL查询测试

Solr发展飞快,现在最新的版本已经6.1.0了,下面来回顾下Solr6.x之后的一些新的特点: (1)并行SQL特性支持,编译成Streaming 表达式,可以在solrcloud集 ...
qindongliang1922 评论(2) 有2382人浏览 2016-07-12 11:21

全文检索

全文检索(full-text search),是指从文本或数据库中,不限定资料字段,自由地萃取出讯息的技术。 而搜索引擎(search engine),是指执行全文检索任务的程序,一般称作搜索引擎(search engine),它将使用者随意输入的文字,试图从数据库中,找到符合的内容 <li> 标签定义列表项目。 <li> 标签可用在有序列表 (<ol>) 和无 ...
weitao1026 评论(0) 有343人浏览 2016-07-01 19:16

(转)sql调优

1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t where num is null 可以在num上设置默认值0,确保表中num列没有null值,然后这样查询: select id fr ...
吟恋错 评论(0) 有629人浏览 2016-05-11 20:01

如何使用Hive集成Solr?

(一)Hive+Solr简介 Hive作为Hadoop生态系统里面离线的数据仓库,可以非常方便的使用SQL的方式来离线分析海量的历史数据,并根据分析的结果,来干一 ...
qindongliang1922 评论(0) 有2844人浏览 2016-03-17 15:05

最近博客热门TAG

应用服务器(43288) Spring(40812) Hibernate(33330) Tomcat(28345) 框架(27200) 设计模式(24056) Servlet(23313) Struts(22805) Bean(22194) 企业应用(18268) thread(15826) 多线程(14801) SUN(11436) 虚拟机(11382) Cache(11314) Security(8002) SSH(7109) DAO(6880) MVC(6206) AOP(6187)

博客人气排行榜

    博客电子书下载排行

      >>浏览更多下载

      相关资讯

      相关讨论

      Global site tag (gtag.js) - Google Analytics