基于很多项目中都都可能会使用到针对海量文档信息进行实时检索的需要!对于用户而言比较习惯于百度搜索的使用!本文针对海量文档检索的需求进行描述!针对海量的文档数据我们需要做到最起码两点:1、高效索引 2、高效搜索。当然做到这两点我们需要在我们的项目中完成多道工序,根据索引框架的特点,做相应的优化工作,这样基本上可以完成80%以上的需要,那20%的缺陷可能来自于索引框架本身的局限,比如lucene本身的一些缺点,也可能来自你的编码上的设计。闲话少说,如下是本人针对很多项目中将会使用的一些文档检索的开发案例。开发案例是在jplogic上实现,可移植到其他项目中,如下是海量文档检索功能实现(欢迎进入群【376447127】):
相对简洁的页面(不需要美工额外的设计,每个工程师都可以定制漂亮的界面)
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-<span style="color:#ff0000;">transitional</span>.dtd">
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%>
<%@ taglib uri="/WEB-INF/tagtld/htmlTagComponet.tld" prefix="JB"%>
<html>
<head>
<style>
html,body {
width: 100%;
height: 100%;
margin: 0px;
padding: 0px;
overflow: hidden;
}
</style>
<JB:ComponentBase id="bomponentBase" isJudgeSession="true" ></JB:ComponentBase>
<title>全文检索列表</title>
<script>
var formOperate = new FormOperateObject();
function okOperate(){
closeBlDialog();
}
function noOperate(){
closeBlDialog();
}
//全文检索操作
function toolbarall_textOperate(id) {
//搜索按钮
if (id == 'all_text_Toolbar4') {
var value = $.trim(toolbar_all_text_Toolbar.getValue('all_text_Toolbar2'));
if (value == '') {
OpenBlDialog('提示','搜索关键字不能为空!','WARN','','','okOperate()','noOperate()','','');
} else {
var url = 'jsp/JpSystem/doc/DocAllTextQueryResultForm.jsp?queryParam=' +value;
url = formOperate.changeURLParamValue(url,'queryParam',value);
layout_all_text_layout.cells('a').attachURL(url);
}
}
}
</script>
</head>
<body id="all_text_body" >
<div id="query_result" style="padding:4px;width:99%;height:100%;font-family:'宋体';font-size:50px;overflow:auto;display: none;text-align: center;">
<b>欢迎进入知识库信息检索,输入相应的知识库信息关联的<font color='red'>关键字</font>即可</b>
</div>
<!-- 布局管理器 -->
<JB:LayoutComponent layoutPattern="1C" parentId="all_text_body" id="all_text_layout" autoReSize="true" isAttachProgress="true">
<!-- 全文操作 -->
<JB:LayoutCellComponent id="abc" layoutCellTitle="全文检索" layoutId="all_text_layout" layoutCellName="a" embeddedToolbarId="all_text_Toolbar" attachObjectId="query_result" hiddenHead="false" layoutCellHeigth="600">
<JB:ToolBarComponent id="all_text_Toolbar" layoutCellToolbarId="all_text_Toolbar" onclick="toolbarall_textOperate" title="全文检索操作" gridId="">
<JB:ToolBarCellComponent id="all_text_Toolbar" cellType="text" btnSelectName="<b>关键词搜索</b>" imgDisabled="save_dis.gif" imgEnabled="save.gif" itemId="0" optionItems=""></JB:ToolBarCellComponent>
<JB:ToolBarCellComponent id="all_text_Toolbar" cellType="separator" imgDisabled="" imgEnabled="" itemId="1" optionItems=""></JB:ToolBarCellComponent>
<JB:ToolBarCellComponent id="all_text_Toolbar" cellType="input" btnSelectName="" inputTextWidth="600" imgDisabled="new_dis.gif" imgEnabled="new.gif" itemId="2" optionItems="" ></JB:ToolBarCellComponent>
<JB:ToolBarCellComponent id="all_text_Toolbar" cellType="separator" imgDisabled="" imgEnabled="" itemId="3" optionItems=""></JB:ToolBarCellComponent>
<JB:ToolBarCellComponent id="all_text_Toolbar" cellType="button" btnSelectName="<b>开始检索</b>" imgDisabled="new_dis.gif" imgEnabled="new.gif" itemId="4" optionItems=""></JB:ToolBarCellComponent>
</JB:ToolBarComponent>
</JB:LayoutCellComponent>
</JB:LayoutComponent>
</body>
</html>
系统界面:
海量文档检索首页
知识库资料上传以及追加
检索结果列表
文档预览
文档下载
下载结果
分享到:
相关推荐
OpenGL ES 1.0 开发库是针对嵌入式设备,如智能手机和平板电脑等,设计的一个图形处理标准。它是OpenGL的精简版,专为资源有限的移动平台提供了高效且功能丰富的2D和3D图形渲染能力。OpenGL ES 1.0是该系列的第一个...
这个系统的核心目标是为用户提供快速、准确的信息检索功能,使得网站内容可以被有效地索引、搜索和展示。 【描述】提到的"百分百完全可用"意味着这套源码已经经过了完整的开发和测试流程,用户在下载后可以直接部署...
《Java开发知识库管理系统》 Java开发语言是全球范围内广泛应用的编程语言,尤其在企业级应用和服务器端开发中占据主导地位。本资料"java开发知识库管理系统.zip"提供了一个完整的源码参考,旨在帮助开发者深入理解...
"谷谷搜图片搜索仿百度 v1.0" 是一个基于ASP编程语言开发的图片搜索引擎系统,其设计灵感来源于知名的百度搜索引擎,尤其是它的图片搜索功能。这个项目可能旨在为用户提供一个类似的图片搜索体验,允许用户在特定的...
【标题】"搜猫搜索引擎源码|仿百度搜索引擎源码"揭示了这是一份与搜索引擎相关的源代码,特别提到了“搜猫”品牌,并模仿了知名的百度搜索引擎的某些功能或设计。这个源码可能是用于学习、研究或者开发自己的搜索...
本文档将深入探讨网络检索系统的开发、管理和演示过程,旨在提供全面的技术指导和实践案例。 首先,我们要了解网络检索系统的核心组件和工作原理。系统通常包括以下几个部分:前端用户界面,后端检索引擎,索引构建...
《搜客搜索引擎 v1.0 免费版》是一款专为用户提供便捷搜索服务的应用软件,其核心在于通过高效的算法和优化的数据结构,帮助用户快速、准确地获取所需信息。在这个免费版本中,用户可以享受到无需付费的搜索服务,...
【标题】"谷谷搜图片搜索仿百度 v1.0.rar" 暗示这是一个基于ASP编程语言开发的源码,旨在实现一个类似百度图片搜索的功能。这个版本号为v1.0,意味着这是该软件的初步版本,可能包含基本功能但可能存在一些未完善的...
搜索引擎是互联网上用于帮助用户检索信息的重要工具。它的工作原理可以分为几个核心部分:爬虫、索引、查询处理和排序。在本项目“仿百度搜索引擎”中,我们将探讨这些基本概念,并尝试用简洁的代码实现一个简易的...
知识库管理软件中文编程源码文件是一套专为管理和组织各种知识内容而设计的软件开发资源,它包含用于创建、存储、检索和分享知识库的源代码。这套源码文件适用于那些希望定制或理解知识库管理系统工作原理的开发者,...
Lucene是Apache软件基金会的开源项目,是一款强大的全文检索库,被广泛应用于Java开发中,为开发者提供了构建高性能搜索引擎的能力。在本文中,我们将深入探讨如何基于Lucene 2.4版本创建简单的全文索引并进行搜索...
《基于Lucene.Net开发的个人知识库》 在信息技术领域,高效的信息检索和管理是至关重要的。Lucene.Net,作为Apache Lucene项目的一个.NET版本,为开发者提供了强大的全文搜索引擎库,使得开发者能够轻松构建自己的...
百度云网盘搜索引擎是一个以PHP+MySQL进行开发的网盘搜索引擎源码。运行环境:开始之前你需要安装* PHP 5.3.7 +* MySQL* Python 2.7 ~* [xunsearch](http9000; fastcgi_index index.php; include fastcgi.conf; ...
标题中的“在线flash文档阅读器(asp.net全文索引,仿百度文库)”是指一个基于ASP.NET技术开发的Web应用程序,其主要功能是提供类似百度文库的在线文档查看服务,用户无需下载文档,即可通过浏览器浏览PDF、DOC等格式...
"搜索引擎"标签则强调了这是一个关于信息检索的项目,涉及网页抓取、索引构建、查询处理和结果排序等核心技术。 【压缩包子文件的文件名称列表】"chuizhisearch"可能是指整个项目的根目录或者包含了项目源代码、...
【标题】:“百度硬盘搜索,本地文件索引”这一标题提到了百度开发的一款高效实用的本地文件检索工具——百度硬盘搜索。它专为用户设计,旨在帮助他们在个人计算机上快速定位和查找所需的文件。 【描述】:“百度...
《百度搜索引擎优化指南VER 1.0》是百度官方发布的一份重要文档,旨在帮助网站开发者和SEO从业者更好地理解和遵循其搜索引擎的工作原理,提升网站在百度搜索结果中的排名。这份PDF版指南详细阐述了如何优化网站以...
本文将深入探讨“最新仿百度搜索引擎,带蜘蛛”这一主题,包括搜索引擎的基本原理、蜘蛛爬虫的工作方式,以及与百度搜索引擎的相似之处。 首先,搜索引擎的核心功能是为用户提供信息检索服务。它通过抓取、索引和...
【易搜索 站内全文检索搜索引擎 v1.0_yssfor】是一款专门针对网站内部内容进行快速全文检索的搜索引擎工具。它旨在提高用户在特定网站内的信息查找效率,为网站提供更便捷的信息检索服务。这款软件的核心功能是实现...
DBExportDoc V1.0 For Oracle是一款专门针对Oracle数据库设计的工具,它的主要功能是将Oracle数据库中的表结构完整地导出为Word文档,便于用户进行数据库设计的文档记录、分享和审查。这款工具简化了数据库管理人员...