系统简介:
大数据的特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。大数据搜索引擎的主要挑战在于:海量处理规模、多字段多类型数据融合、高效的索引压缩技术及毫秒级的索引更新技术。
JZSearch大数据搜索引擎是灵玖软件联合中科院与北理工的信息检索专家,针对大数据搜索业务需求而打造的一套搜索引擎,具有专业精准、高扩展性和高通用性的特点。可支持文本、数字、日期、字符串等各种数据类型的高效索引,支持邻近搜索、负面搜索、语义关联搜索,可提供各类数据库的实时搜索服务,并支持少数民族语言。目前已经应用于中国邮政搜索引擎、河北省标准搜索引擎、富基融通(纳斯达克上市公司:EFUT)商品搜索以及新疆维文搜索引擎。
主要功能:
搜索基本功能包括:
1多字段关联搜索:非结构化与结构化字段的关联搜索,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;
2 指定字段排序:可以按照任意指定字段的排序;
3 精确搜索:支持精确匹配以及模糊匹配,默认为模糊匹配,忽略字母大小写,采用双引号进行精确匹配;
搜索特色功能包括:
1 内嵌正负面情感等极性分析,可以搜索任意对象的正负面结果;
2 语义联想搜索:如搜索“马铃薯”可以同时返回“土豆”的内容,搜索“北京市”可以返回“北京”或者“首都”的内容;语义联系词表用户可以自行根据专业知识定制;
3 搜索结果去重:按照指定字段对搜索结果进行去重;
4 邻近搜索功能:可以要求两个关键词必须在一定的词场范围内。
5 内嵌了智能分词系统。
6 数据库实时同步:数据库增删改10秒内即可同步到搜索引擎中
搜索维护功能包括:
1 支持增量索引:系统可以在搜索服务不停的前提下,继续索引新的数据,索引完成后,可以搜索新的数据;
2 自动备份与恢复机制,在建立索引和自动优化之前,在当前索引文件被破坏无法搜索的前提下,系统将自动恢复上次搜索正常的备份文件;
3 自动缓存机制:系统自动保存最近常用的搜索条件与结果,再次搜索时将直接推送搜索结果内容,可以将搜索响应速度提升30%以上;缓存会随着新的索引数据自动更新,不存在缓存延迟问题;
4 自动优化机制:在系统索引碎片较多时,系统会自动优化归并;
5 屏蔽指定文档、指定关键词的搜索服务,也可以恢复屏蔽信息;
6 实现的是多线程搜索服务;
7 兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等。系统支持多表关联搜索;支持Windows/Linux/FreeBSD等操作系统,支持C/C++/C#/Java二次开发。
应用案例:
典型应用包括:中国邮政搜索引擎、河北省标准搜索引擎、富基融通(纳斯达克上市公司:EFUT)商品搜索以及新疆维文搜索引擎。
性能指标:
操作系统:Win/Linux/FreeBSD均可,支持32位/64位;SaaS API支持各类应用开发语言
关系数据库:支持MySQL,Oracle, SQL Server等主流数据库
速度:分词平均速度:20MB/s *索引平均速度:10MB/s,搜索毫秒级
并行吞吐量:单机每秒并行处理1000+搜索请求;处理信息规模:TB级
浏览器:MS Internet Explorer 6.0 SP2以上
硬件配置:单机、多机并行均可
分享到:
相关推荐
JZSearch精准搜索引擎技术白皮书是一份详细的技术文档,由Kevin Zhang于2012年创作并持续更新,旨在介绍JZSearch这一精准搜索引擎的特性和使用方法。该白皮书涵盖了从基础到高级的各种功能,包括搜索引擎的构建、...
JZSearch是一款由Kevin Zhang开发的精准搜索引擎,其技术白皮书详细介绍了该搜索引擎的核心功能和不断迭代的改进。此搜索引擎旨在提供高效、精准的信息检索服务,尤其在文本处理和信息提取方面具有特色。 1. **基本...
### 一、JZSearch精准搜索引擎简介 **1.1 JZSearch精准搜索引擎介绍** JZSearch是一款由Kevin Zhang开发的精准搜索引擎,其主要特点在于能够提供高效且准确的信息检索功能。这款引擎通过一系列高级算法和技术,...
以九眼智能文档核查云平台为例,该平台采用了NLPIR大数据语义智能分析、JZSearch大数据精准搜索引擎和KGB知识图谱引擎等先进技术。平台的核心功能包括: 1. 文档知识抽取:通过KGB知识抽取引擎,可以从结构化和非...
白色简洁风格的韩国个人网页源码下载.zip
基于AT89C51的超声波测距
白色宽屏风格的室内设计公司整站网站源码下载.zip
白色简洁风格的眼睛设计制作企业网站模板.zip
基于Mysql和OpenCV的人脸识别系统(源码和部署教程).zip。内容来源于网络分享,如有侵权请联系我删除。另外如果没有积分的同学需要下载,请私信我。
“预防夏季中暑”知识讲座教案课件
Java毕业设计-基于springboot+vue的在线教育平台源码+文档+视频教程 系统说明: 3.3 角色功能分析 3.3.1 管理员用例分析 数据统计:管理员可以查看系统的数据统计信息,如用户数量、订单数量等。 轮播管理:管理员可以管理系统首页的轮播图内容,包括添加、编辑、删除等操作。 课程管理:管理员可以管理系统中的课程信息,包括审核待审批的课程、编辑课程内容等。 分类管理:管理员可以管理课程的分类信息,包括添加、编辑、删除分类。 讲师管理:管理员可以管理系统中的讲师信息,包括审核讲师入驻申请、编辑讲师信息等。 学员管理:管理员可以管理系统中的学员信息,包括查看学员列表、禁用学员账号等。 用户管理:管理员可以管理系统中的用户信息,包括查看用户列表、禁用用户账号等。 订单管理:管理员可以管理系统中的订单信息,包括查看订单列表、处理订单退款等操作。如下图3-1所示: 图3-1 管理员用例图 管理员用例表描述了管理员在黑板擦在线教育系统中的常见操作,包括登录系统、数据统计、轮播管理、课程审核和分类管理等。管理员首先通过输入用户名和密码登录系统,然后可以查看系统的数
采用QT写了一个基于UDP协议的数据发送小程序,可以发送自定义帧结构数据和记录的数据文件,使用方便。
其实这就是历年摘出来的
在传统信息管理方法中,我们面临诸多挑战:处理信息耗时、数据错误率高、数据修正困难以及数据检索不便。为了解决这些问题,引入计算机化的疫苗预约系统软件显得尤为重要,这样的系统不仅能够规范信息管理流程,实现管理工作的系统化和程序化,还能帮助管理人员准确、迅速地处理信息。 在开发工具的选择上,我们经过慎重考虑,最终选择了Eclipse作为开发工具,以及Mysql作为数据库工具,以便于实现疫苗预约系统的各项功能。系统的核心功能包括管理员对用户的管理以及新闻公告的发布。 疫苗预约系统是一款基于软件开发技术构建的应用系统,它在信息处理方面表现出色,无论是数据的快速添加、维护、统计还是查询,都能轻松应对,极大地提高了信息处理的速度和准确性。
基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目),本资源中的源码都是经过本地编译过可运行的,评审分达到98分,资源项目的难度比较适中,内容都是经过助教老师审定过的能够满足学习、毕业设计、期末大作业和课程设计使用需求,如果有需要的话可以放心下载使用。 基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python的二手房数据分析完整源码+说明文档+分析报告+数据(高分项目)基于python
白色宽屏风格的肉制品销售企业网站模板.zip
白色简洁风格的房产交易中心企业网站源码下载.zip
这个东东可以对木马和其他病毒进行加强加固,防止被杀毒软件露头就秒了
白色简洁风格的高级西餐牛排模板下载.zip