采用全文索引解决模糊查询速度慢的问题 -

z_kanhai

浏览: 53172 次
性别:
来自: 北京

最近访客更多访客>>

svygh123

zhangyongjuan

chuanggui2016

woodding2008

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

采用全文索引解决模糊查询速度慢的问题

博客分类：

ORACLE

众所周知，使用 like 进行模糊查询速度极差，包括 like 'AAA%' ，like '%AAA'，like '%AAA%'，like '%A%A%'以及采用“_”进行单字符匹配的那些模糊查询。网上有很多文章讲到如何提高like查询，提到 like 'AAA%'能够使用到索引，而like '%AAA' ，使用创建反向函数的索引来提高查询效率。但一般情况下，是无法约定客户端采用哪种like查询，难道说把所有的这些情况都进行if判断吗？

为这个事情脑袋疼了无数次。最近，一客户“无理”要求对用户地址模糊查询速度太慢。在数十万的用户记录下查询，要求5秒之内必须查询到记录。

想破脑袋还是找不到方法。有同事找了本Lucene的书给我看，说是能解决。翻来覆去的看了2，3遍，始终想不出这玩意儿怎么用。

突然想到oracle也有全文索引一说，以前只是别人提起过这个词。与网上朋友一聊，说是似乎可以解决，但他忘了怎么用了。

半夜12点，赶紧爬起来，到google上查资料。还真有两下子，研究了几个小时，有所获。第二天白天没时间研究，晚上继续，最终把全文索引搞定，解决了模糊查询速度慢的问题，在数十万条用户数据中，对用户地址进行模糊查询速度在2秒以内就能够查到。

-------------------------------------------------------------------------

以下是创建全文索引的方法（网上有文章提到使用图形化界面，我用图形化界面创建全文索引，创建了一个晚上，第二天起床居然还没完。但用SQL命令15分钟左右就搞定）：

对cmng_custominfo 表中的address字段做全文检索：
1，在oracle9201中需要创建一个分词的东西：

BEGIN
ctx_ddl.create_preference ('SMS_ADDRESS_LEXER', 'CHINESE_LEXER');
--ctx_ddl.create_preference ('my_lexer', 'chinese_vgram_lexer'); 不用
end;

2，创建全文检索：

CREATE INDEX INX_CUSTOMINFO_ADDR_DOCS ON cmng_custominfo(address) INDEXTYPE IS CTXSYS.CONTEXT PARAMETERS ('LEXER SMS_ADDRESS_LEXER');

3，查询时候，使用：

select * from cmng_custominfo where contains (address, '金色新城')>1;

自己测试,发现select * from cmng_custominfo where contains (address, '%金色新城%')>1;才能实现模糊查询,并且使用了索引,数据库版本为oracle9.0.1.1.1

4，需要定期进行同步和优化：
同步：根据新增记录的文本内容更新全文搜索的索引。

begin
ctx_ddl.sync_index('INX_CUSTOMINFO_ADDR_DOCS');
end;

优化：根据被删除记录清除全文搜索索引中的垃圾

begin
ctx_ddl.optimize_index('INX_CUSTOMINFO_ADDR_DOCS', 'FAST');
end;

5，采用job做步骤4中的工作：

1)该功能需要利用oracle的JOB功能来完成
因为oracle9I默认不启用JOB功能，所以首先需要增加ORACLE数据库实例的JOB配置参数：
job_queue_processes=5
重新启动oracle数据库服务和listener服务。

2)同步和优化
--同步 sync:
variable jobno number;
BEGIN
DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.sync_index(''INX_CUSTOMINFO_ADDR_DOCS'');', SYSDATE, 'SYSDATE + (1/24/4)');
　commit;
END;

--优化
variable jobno number;
begin
　DBMS_JOB.SUBMIT(:jobno,'ctx_ddl.optimize_index(''INX_CUSTOMINFO_ADDR_DOCS'',''FULL'');', SYSDATE, 'SYSDATE + 1');
　commit;
END;

其中，第一个job的SYSDATE + (1/24/4)是指每隔15分钟同步一次，第二个job的SYSDATE + 1是每隔1天做一次全优化。具体的时间间隔，可以根据应用的需要而定

6，索引重建
重建索引会删除原来的索引，重新生成索引，需要较长的时间。
重建索引语法如下：
ALTER INDEX INX_CUSTOMINFO_ADDR_DOCS REBUILD;

据网上一些用家的体会，oracle重建索引的速度也是比较快的，有一用家这样描述：

Oracle 的全文检索建立和维护索引要比ms sql server都要快得多，笔者的65万记录的一个表建立索引只需要20分钟，同步一次只需要1分钟。
因此，也可以考虑用job的办法定期重建索引。

参考资料：
1，http://blog.csdn.net/yurenjia/archive/2007/04/08/1556306.aspx
2，http://topic.csdn.net/u/20080117/23/34004f4a-4989-47ef-8764-0b7e3bf737a7.html
3，http://tenwe.com/tech/database/oracle/200702/content_561_4.shtml
4，http://www.knowsky.com/389357.html
5，http://yangtingkun.itpub.net/post/468/195520
6，http://bbs.zdnet.com.cn/archiver/tid-120474.html
7，http://bbs.违规广告.com/archiver/tid-26270.html
8，http://oracle.**.com/exploiture/720104_3.html
9，http://www.33kuai.cn/html/shujuku/20080126/5314_2.html
10，http://www.xrss.cn/Dev/DataBase/20084218963.Html

分享到：

oracle 数据库里查看表空间使用状况 | buffer 与cache 的区别

2011-08-04 23:31
浏览 779
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

基于MATLAB GUI与CNN的模糊车牌识别系统：从图像预处理到字符识别全流程解析: 内容概要：本文详细介绍了基于MATLAB GUI界面和卷积神经网络(CNN)的模糊车牌识别系统。该系统旨在解决现实中车牌因模糊不清导致识别困难的问题。文中阐述了整个流程的关键步骤，包括图像的模糊还原、灰度化、阈值化、边缘检测、孔洞填充、形态学操作、滤波操作、车牌定位、字符分割以及最终的字符识别。通过使用维纳滤波或最小二乘法约束滤波进行模糊还原，再利用CNN的强大特征提取能力完成字符分类。此外，还特别强调了MATLAB GUI界面的设计，使得用户能直观便捷地操作整个系统。适合人群：对图像处理和深度学习感兴趣的科研人员、高校学生及从事相关领域的工程师。使用场景及目标：适用于交通管理、智能停车场等领域，用于提升车牌识别的准确性和效率，特别是在面对模糊车牌时的表现。其他说明：文中提供了部分关键代码片段作为参考，并对实验结果进行了详细的分析，展示了系统在不同环境下的表现情况及其潜在的应用前景。

嵌入式八股文面试题库资料知识宝典-计算机专业试题.zip: 嵌入式八股文面试题库资料知识宝典-计算机专业试题.zip

嵌入式八股文面试题库资料知识宝典-C and C++ normal interview_3.zip: 嵌入式八股文面试题库资料知识宝典-C and C++ normal interview_3.zip

开关磁阻电机技术参数与建模技术深度解析：4kW电机性能详述: 内容概要：本文深入探讨了一款额定功率为4kW的开关磁阻电机，详细介绍了其性能参数如额定功率、转速、效率、输出转矩和脉动率等。同时，文章还展示了利用RMxprt、Maxwell 2D和3D模型对该电机进行仿真的方法和技术，通过外电路分析进一步研究其电气性能和动态响应特性。最后，文章提供了基于RMxprt模型的MATLAB仿真代码示例，帮助读者理解电机的工作原理及其性能特点。适合人群：从事电机设计、工业自动化领域的工程师和技术人员，尤其是对开关磁阻电机感兴趣的科研工作者。使用场景及目标：适用于希望深入了解开关磁阻电机特性和建模技术的研究人员，在新产品开发或现有产品改进时作为参考资料。其他说明：文中提供的代码示例仅用于演示目的，实际操作时需根据所用软件的具体情况进行适当修改。

少儿编程scratch项目源代码文件案例素材-剑客冲刺.zip: 少儿编程scratch项目源代码文件案例素材-剑客冲刺.zip

少儿编程scratch项目源代码文件案例素材-几何冲刺转瞬即逝.zip: 少儿编程scratch项目源代码文件案例素材-几何冲刺转瞬即逝.zip

四象限直流电机速度驱动控制系统PID控制仿真模型设计与实现: 内容概要：本文详细介绍了基于PID控制器的四象限直流电机速度驱动控制系统仿真模型及其永磁直流电机（PMDC）转速控制模型。首先阐述了PID控制器的工作原理，即通过对系统误差的比例、积分和微分运算来调整电机的驱动信号，从而实现转速的精确控制。接着讨论了如何利用PID控制器使有刷PMDC电机在四个象限中精确跟踪参考速度，并展示了仿真模型在应对快速负载扰动时的有效性和稳定性。最后，提供了Simulink仿真模型和详细的Word模型说明文档，帮助读者理解和调整PID控制器参数，以达到最佳控制效果。适合人群：从事电力电子与电机控制领域的研究人员和技术人员，尤其是对四象限直流电机速度驱动控制系统感兴趣的读者。使用场景及目标：适用于需要深入了解和掌握四象限直流电机速度驱动控制系统设计与实现的研究人员和技术人员。目标是在实际项目中能够运用PID控制器实现电机转速的精确控制，并提高系统的稳定性和抗干扰能力。其他说明：文中引用了多篇相关领域的权威文献，确保了理论依据的可靠性和实用性。此外，提供的Simulink模型和Word文档有助于读者更好地理解和实践所介绍的内容。

嵌入式八股文面试题库资料知识宝典-2013年海康威视校园招聘嵌入式开发笔试题.zip: 嵌入式八股文面试题库资料知识宝典-2013年海康威视校园招聘嵌入式开发笔试题.zip

少儿编程scratch项目源代码文件案例素材-驾驶通关.zip: 少儿编程scratch项目源代码文件案例素材-驾驶通关.zip

小区开放对周边道路通行能力影响的研究.pdf: 小区开放对周边道路通行能力影响的研究.pdf

冷链物流路径优化：基于NSGA-2遗传算法与软硬时间窗策略的研究: 内容概要：本文探讨了冷链物流车辆路径优化问题，特别是如何通过NSGA-2遗传算法和软硬时间窗策略来实现高效、环保和高客户满意度的路径规划。文中介绍了冷链物流的特点及其重要性，提出了软时间窗概念，允许一定的配送时间弹性，同时考虑碳排放成本，以达到绿色物流的目的。此外，还讨论了如何将客户满意度作为路径优化的重要评价标准之一。最后，通过一段简化的Python代码展示了遗传算法的应用。适合人群：从事物流管理、冷链物流运营的专业人士，以及对遗传算法和路径优化感兴趣的科研人员和技术开发者。使用场景及目标：适用于冷链物流企业，旨在优化配送路线，降低运营成本，减少碳排放，提升客户满意度。目标是帮助企业实现绿色、高效的物流配送系统。其他说明：文中提供的代码仅为示意，实际应用需根据具体情况调整参数设置和模型构建。

少儿编程scratch项目源代码文件案例素材-恐怖矿井.zip: 少儿编程scratch项目源代码文件案例素材-恐怖矿井.zip

基于STM32F030的无刷电机高压FOC控制方案：滑膜无感FOC技术及保护机制: 内容概要：本文详细介绍了基于STM32F030的无刷电机控制方案，重点在于高压FOC（磁场定向控制）技术和滑膜无感FOC的应用。该方案实现了过载、过欠压、堵转等多种保护机制，并提供了完整的源码、原理图和PCB设计。文中展示了关键代码片段，如滑膜观测器和电流环处理，以及保护机制的具体实现方法。此外，还提到了方案的移植要点和实际测试效果，确保系统的稳定性和高效性。适合人群：嵌入式系统开发者、电机控制系统工程师、硬件工程师。使用场景及目标：适用于需要高性能无刷电机控制的应用场景，如工业自动化设备、无人机、电动工具等。目标是提供一种成熟的、经过验证的无刷电机控制方案，帮助开发者快速实现并优化电机控制性能。其他说明：提供的资料包括详细的原理图、PCB设计文件、源码及测试视频，方便开发者进行学习和应用。

基于有限体积法Godunov格式的管道泄漏检测模型研究.pdf: 基于有限体积法Godunov格式的管道泄漏检测模型研究.pdf

嵌入式八股文面试题库资料知识宝典-CC++笔试题-深圳有为（2019.2.28）1.zip: 嵌入式八股文面试题库资料知识宝典-CC++笔试题-深圳有为（2019.2.28）1.zip

少儿编程scratch项目源代码文件案例素材-几何冲刺 V1.5.zip: 少儿编程scratch项目源代码文件案例素材-几何冲刺 V1.5.zip

Android系统开发_Linux内核配置_USB-HID设备模拟_通过root权限将Android设备转换为全功能USB键盘的项目实现_该项目需要内核支持configFS文件系统.zip: Android系统开发_Linux内核配置_USB-HID设备模拟_通过root权限将Android设备转换为全功能USB键盘的项目实现_该项目需要内核支持configFS文件系统

C# WPF - LiveCharts Project: C# WPF - LiveCharts Project

少儿编程scratch项目源代码文件案例素材-恐怖叉子动画.zip: 少儿编程scratch项目源代码文件案例素材-恐怖叉子动画.zip

嵌入式八股文面试题库资料知识宝典-嵌⼊式⼯程师⾯试⾼频问题.zip: 嵌入式八股文面试题库资料知识宝典-嵌⼊式⼯程师⾯试⾼频问题.zip

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

采用全文索引解决模糊查询速度慢的问题

评论

发表评论

相关推荐

Oracle的left join中on和where的区别

动态sql拼接单引号与 变量赋值

ora-00031:session marked for kill处理oracle中杀不掉的锁

使用DBLINK为远程数据库的用户表创建同义词

以字符串数组为输入参数的存储过程

函数的使用

Oracle中decode的使简单例子

oracle触发器

oracle的全文索引

单独的plsql链接数据库

Oracle经验集锦

两个数据库字符集不一样,如何快速增量同步数据.

Oracle分区表详解 .

利用 rowid 提升update性能 .

oracle全文索引的简单配置

用java调用oracle存储过程总结

Oracle SCN详解

oracle 数据库里查看表空间使用状况

oracle9i在windows上的dataguard配置

Rman duplicate数据库复制(单系统)

最近访客更多访客>>

动态sql拼接单引号与变量赋值