转载请标明出处: http://fuliang.iteye.com/blog/1063352
索引基础知识
索引是帮助MySQL有效检索数据的一种数据结构,它是获得高性能的关键,但是人们常常忘记或者错误的理解了它,所以索引通常是现实中最常出现的性能问题。
当你的数据变得很大时,索引变得非常重要,即使很轻负载的数据库没有恰当的索引,随着数据的增加,性能也会很快的下降。
MySQL使用索引都是一种类似的方式,他首先对给定的值搜索索引结构,如果在索引中找到,再去找包含匹配的行。
当你对多于一行的数据建索引的时候,索引的次序很重要,因为MySQL只能使用索引的最左前缀来有效进行搜索。对两列进行建索引和分别对单个列检索是不同的。
索引类型
有很多类型的索引,每种索引的设计在不同的目的下达到高效,索引是在存储引擎下实现的,并不是在服务层,因此他并没有被标准化:索引在不同的存储引擎不同,不是所有的引擎都支持所有的索引类型。即使多个索引支持同一种索引类型,也可能有不同的实现。
B-Tree索引
当人们谈论索引但没有提及类型时,他们通常指的是B-Tree索引,使用B-Tree的数据结构来存储索引。大多数的存储引擎支持这种索引类型。Archive引擎是个例外,直到5.1还没有支持索引,刚开始支持单索引的AUTO_INCREMENT列。
我们使用"B-Tree"来描述索引,因为CREATE TABLE和其他的语句都使用这个术语,但是不同的存储引擎结构。比如NDB聚类存储引擎使用T-Tree,但是标记BTREE。
不同的存储引擎存储B-Tree索引的方式不同,这会影响性能。比如MyISAM使用前缀压缩技术来让索引变得更小,然后InnoDB并没有压缩索引,因为他不能使用压缩的索引来优化。MyISAM索引直接指向行存储的物理地址,但是InnoDB通过主键的值来引用行,每一种方式都有优缺点。
B-Tree的一般观点是所有的值都有序的存储,每一个节点到根节点都有相同的距离。MyISAM使用不同的结构,但是基本上都是相似的。
由于B-Tree的索引列是有序的,他们对于搜索区间非常有用,比如查找“所有名字以I到K开头的”人,这是很有效的。
可以使用B-Tree索引的类型:B-Tree索引对于查找全部key的值,键的区间或者键的前缀。对
比如有以下表:
CREATE TABLE People (
last_name varchar(50) not null,
first_name varchar(50) not null,
dob date not null,
gender enum('m', 'f') not null,
key(last_name, first_name, dob)
);
于一下集中查询非常有用:
1、匹配全部key的值 匹配所有在索引中的列 where last_name='Allen' and first_name='Cuba' and dob='1960-01-01'
2、最左前缀匹配 where last_name='Cuba' and first_name='Allen'
3.匹配一列的前缀 比如 where last_name like 'J%'
4.匹配一个区间 where last_name between 'Allen' and 'Barrymore'
5.匹配条件中前面的一个条件和区间部分 比如last_name='A' and first_na me like 'J%'
6.仅涉及到index的查询 这种查询只会访问索引,不会访问存储的行。这就是使用覆盖索引优化。select last_name, first_name, dob from People where last_name='Allen'
B-Tree索引的缺陷:
1.如果index的列不是从最左开始,那么索引没有用。
2.不能跳过索引中的一列。比如where last_name='Allen' and dob='1960-01-01'
3.存储引擎不能够优化区间右边的索引,比如:
where last_name='Smith' and first_name like 'J%' and dob='1976-12-23'
索引只能够用到last_name和first_name,因为like是一个区间条件。
所以索引的顺序非常重要,所有这些限制都是和索引的顺序相关。
Hash索引:
hash索引是基于hash表构建的,仅仅对精确查找索引中的列有用。对于每一行,存储引擎
对索引列计算hash code,它在索引中存储hash code和指向行的指针。
在MySQL中,只有Memory存储引擎支持显式的hash索引,是其默认的索引类型,但是Memory表可以使用B-Tree索引。
比如下面的表:
CREATE TABLE testhash (
fname VARCHAR(50) NOT NULL,
lname VARCHAR(50) NOT NULL,
KEY USING HASH(fname)
) ENGINE=MEMORY;
hash索引查询非常的快,然而hash索引有如下缺点:
1.因为索引中只有hash code和指向行的指针,所以MySQL不能直接使用索引的值来避免对行的访问,然而访问内存的行是很快的,所以并不会降低多少性能。
2.MySQL不能使用Hash索引来进行排序,因为他们并不是有序存储的。
3.Hash索引不支持部分key的匹配。因为计算hash code需要整个索引的值。
4.Hash索引仅仅支持等号操作=,in <=> ,所以并不能加快区间查询比如where price > 100
5.使用Hash索引访问数据很快,但是如果有很多冲突也是问题。
6.如果有很多hash冲突,那么维护索引会很慢。比如你一个区分度不是很够的列建立hash索引,那么删除一行,查找对应的一行会很耗时。
这些限制导致hash索引只在一部分特殊情况下比较有用。然而如果符合应用的需求,能够很大的增强访问的速度。
NDB聚类引擎支持唯一hash索引。。
InnoDB具有一个特别的特性被称为适应性hash索引。InnoDB发现比较频繁访问的索引值,会为其在B-Tree索引之上建立Hash索引,这使得B-Tree索引具有一定的hash特性,这个特性是自动的,你无法控制和配置。
构建自己的hash索引:
如果存储引擎不支持hash索引,你可以想InnoDB那样模拟一个。这样你可以获得hash索引很好的特性,比如很长的key具有很小的索引大小。
这个办法很简单:创建一个假的hash索引在标准的B树索引之上。这个和使用真的hash索引不是完全相同的事,它仍能够使用B-Tree索引来查询,但是使用的hash值而不是可以的本身来查找。你只需要在where条件中指定hash函数。
比如对于查找url的例子,url通常导致B-Tree索引变得很大,因为他们很长,我们可以使用
select id from url where url='http://www.mysql.com';
我们可以删除掉对url的索引,添加url_crc列,然后建立索引:
select id from url where url='http://www.mysql.com' and url_crc=CRC32('http://www.mysql.com');
一个缺点是需要维护hash这一列,在MySQL5.0以上版本已经支持触发器,我们可以使用它来维护:
CREATE TABLE pseudohash (
id int unsigned NOT NULL auto_increment,
url varchar(255) NOT NULL,
url_crc int unsigned NOT NULL DEFAULT 0,
PRIMARY KEY(id)
);
我们临时改变一下分隔符,这样分号可以在触发器中使用:
DELIMITER |
CREATE TRIGGER pseudohash_crc_ins BEFORE INSERT ON pseudohash FOR EACH ROW BEGIN
SET NEW.url_crc=crc32(NEW.url);
END;
|
CREATE TRIGGER pseudohash_crc_upd BEFORE UPDATE ON pseudohash FOR EACH ROW BEGIN
SET NEW.url_crc=crc32(NEW.url);
END;
|
DELIMITER ;
如果你使用这种方式,最要不需要选择SHA1和MD5这样的hash函数,他们返回很长的字符产,浪费了很大的空间,导致慢的比较操作。简单的函数能够提供可接受的冲突率,是个比较好的选择。如果有很多的行,CRC32可能导致很多的冲突,实现自己的CRC64函数,确保其返回一个整数,而不是字符串。比如可以简单的这么实现:
SELECT CONV(RIGHT(MD5('http://www.mysql.com/'), 16), 16, 10) AS HASH64;
空间(R-Tree)索引
MyISAM支持空间索引,你可以使用地理空间类型比如geometry。不想B-Tree索引,空间索引不需要是最左前缀的。它同时索引所有维度的数据。这样,查询可以有效使用任何维度组合。
但是你需要使用GIS的函数,比如mbrcontains()。
全文索引
全文索引是MyISAM的一种特殊的索引类型。他可以在文本中查找关键字,而不是直接比较在
索引中的值。全文索引和其他类型的匹配完全不同。他有很多微妙之处,比如停顿词、词根化、和复数归一化,以及bool类型的搜索。和搜索引擎类似。
在一个列建全文索引并不会影响在这列建立B-tree索引。全文索引只对MATCH AGAINST操作有效,对普通的WHERE是无效的。
参考《高性能MySQL》
分享到:
相关推荐
内容概要:本文档详细介绍了VMware虚拟机的安装步骤,涵盖从环境准备到优化与迁移建议的全过程。首先,确保物理机满足VMware的硬件需求,如支持虚拟化的CPU、足够的内存和存储空间。接着,下载并运行VMware Workstation或ESXi的安装程序,完成基本配置和许可证激活,必要时重启系统以启用虚拟化功能。然后,创建新的虚拟机,选择操作系统镜像,合理分配资源并配置网络,以确保虚拟机与外部网络的连通性。之后,启动虚拟机并安装操作系统,完成硬盘分区、格式化等操作,并安装VMware Tools以增强性能。最后,针对平滑迁移和云环境部署提出了建议,强调了兼容性验证和备份与安全的重要性。 适合人群:具有计算机基础,对虚拟化技术有一定了解的技术人员或IT爱好者。 使用场景及目标:①个人用户希望通过VMware创建虚拟机进行操作系统测试或开发环境搭建;②企业级用户进行虚拟化平台的部署和迁移,提高业务连续性和安全性。 阅读建议:此文档提供了详细的VMware虚拟机安装步骤,建议读者在实际操作前仔细阅读每一步骤,并结合自身需求进行合理配置,特别是在资源分配和网络配置方面。对于企业级用户,还需关注云宏等国产虚拟化方案的无感迁移路径以及华为云等云服务商提供的部署指南。
# 基于C++的AWS IoT设备开发工具包 ## 项目简介 本项目是基于C++的AWS IoT设备SDK,用于与AWS IoT的各类服务交互,涵盖影子服务、作业服务和安全隧道服务等。借助该SDK,开发者能够实现设备与AWS IoT服务的连接、通信,完成诸如状态管理、作业执行等操作。 ## 项目的主要特性和功能 1. MQTT协议支持通过MQTT协议实现设备与AWS IoT服务间的通信。 2. 设备影子状态管理可对设备的影子状态进行获取、更新和删除操作。 3. 作业管理支持设备接收作业任务,并更新作业执行状态。 4. 安全隧道服务能在AWS资源间建立安全的通信通道。 5. 错误处理与日志记录具备完善的错误处理和日志记录机制,便于诊断和调试。 6. 多平台支持兼容Windows、Linux和macOS等多种操作系统。 ## 安装使用步骤 ### 环境要求 C++ 11或更高版本(Clang 3.9+、GCC 4.8+或MSVC 2015+)
第16章-超声波跟随功能 基于STM32的三路超声波自动跟随小车 毕业设计 课程设计
Microgrid systems have been recognized as a promising means for renewable energy integration, grid resilience, and power supply to remote areas. The optimal performance of these systems entails numerous challenges in terms of power sharing, stability, and energy harvesting from photovoltaic (PV) systems. The current study aims to improve microgrid performance using advanced control strategies, such as droop control and fuzzy logic-based maximum power point tracking (MPPT), for hybrid PV and battery energy systems. The study commenced with an introduction that portrays the significance of microgrid systems and the reasons for enhancing the operational efficiency of microgrids. The principal challenges associated with microgrid performance, including power quality, frequency regulation, and
内容概要:本文深入探讨了内嵌式永磁同步电机(IPMSM)复矢量电流调节器的设计及其动态解耦问题。首先介绍了IPMSM的基本特性和d、q轴电流存在的动态耦合问题,然后详细推导了复矢量数学模型,展示了如何将d、q轴电流转化为复矢量形式,从而简化了数学表达并消除了交叉耦合项。接着,文章设计了一种基于复矢量的电流调节器,采用比例积分(PI)控制算法,能够分别对d、q轴电流进行精准调节,实现动态解耦。最后,通过Matlab/Simulink进行了仿真验证,证明了该设计方案的有效性和优越性能。 适合人群:从事电机控制系统设计的研究人员和技术工程师,尤其是关注IPMSM电流解耦问题的专业人士。 使用场景及目标:适用于需要提高IPMSM电流控制精度和响应速度的应用场合,如伺服系统和电动汽车驱动。主要目标是解决d、q轴电流之间的动态耦合问题,提升系统的稳定性和可靠性。 其他说明:文中提供了详细的数学推导过程和代码示例,有助于读者理解和实现复矢量电流调节器。同时强调了有效磁链的概念和复矢量运算的优势,指出了实际应用中需要注意的问题,如电感参数的准确性。
# 基于嵌入式系统和Qt的俄罗斯方块游戏 ## 项目简介 本项目是一个基于嵌入式系统Gumstix的俄罗斯方块游戏,由两名开发者合作完成。项目使用C++和Qt库开发游戏逻辑,并通过Linux内核的用户级控制程序和Android应用通过蓝牙进行游戏控制。 ## 项目的主要特性和功能 游戏逻辑使用C++和Qt库实现经典的俄罗斯方块游戏。 用户控制通过Linux内核的用户级控制程序实现游戏控制。 蓝牙控制开发Android应用,通过蓝牙连接Gumstix进行游戏操作。 ## 安装使用步骤 1. 安装Android应用在Android手机上安装UserLevel.apk。 2. 硬件连接将蓝牙模块和其他必要的硬件连接到Gumstix开发板上,并启动Gumstix。 3. 编译代码使用Makefile编译Tetris和ul两个项目,并将生成的可执行文件复制到Gumstix中。
内容概要:本文档为《毕业设计写作全攻略:从选题到答辩的完整指南》,涵盖毕业设计从选题、开题报告撰写、论文写作核心框架与技巧、典型问题解决方案、答辩准备技巧以及资源工具包六个方面。选题部分强调了可行性、创新性和实用性,提供了具体的选题反例和正例。论文写作部分给出了详细的章节结构建议,包括研究背景、关键技术分析、系统设计与实现、实验与结果分析及总结与展望,并提供了写作技巧和避坑指南。对于答辩准备,提出了PPT制作原则、答辩话术模板和模拟方法。 适合人群:即将进行毕业设计的大学生,尤其是计算机相关专业的学生。 使用场景及目标:①帮助学生理解并掌握从选题到答辩的全过程;②提供实用的写作技巧和避坑指南,确保毕业设计顺利完成;③为答辩环节做好充分准备,提高答辩成功率。 其他说明:文档不仅提供了理论指导,还附有写作思路、避坑技巧与万能模板,旨在帮助学生更好地完成毕业设计,顺利过渡到职业生涯。此外,文档还推荐了一些辅助工具,如Overleaf、Grammarly等,以提升写作质量和效率。
华为OD机考辅导材料50题
蓝桥杯
notepad++ 插件 android logger 支持lexer fot App & Radio Log, 和自定义 支持从设备捕获日志! 支持在设备上启动命令行控制台或运行选定的Shell命令。 支持捕获设备截图,目前仅保存为 d:\device.bmp 支持文件浏览器功能! 提供Unix时间戳转换工具,轻松实现时间转换!
# 基于STM32L011F4微控制器的智能手表固件项目(简称“SMART WATCH FIRMWARE”) ## 项目简介 SMART WATCH FIRMWARE是一个基于STM32L011F4微控制器的智能手表固件项目。该项目旨在开发一个具有实时时钟、日期显示、电量监控、用户交互等功能的手表固件。通过使用特定的硬件和软件组件,该项目提供了一个完整的手表固件解决方案,旨在实现低功耗、高性能的用户体验。 ## 项目的主要特性和功能 1. 硬件初始化包括微控制器、显示设备、输入设备等硬件的初始化和配置。 2. 状态机管理控制用户界面状态,包括时间显示、日期显示、电量监控等。 3. 显示驱动控制显示设备的显示内容,如时间、日期和电量等。 4. 输入处理处理用户的输入操作,如按键或触摸等。 5. 时间管理提供实时时钟功能,包括时间的设置和显示。 6. 代码质量检查使用clangtidy和Cppcheck等工具进行代码静态分析,确保代码质量。
内容概要:本文详细探讨了齿轮系统在不同阻尼比条件下表现出的非线性动力学特性。通过构建微分方程并在MATLAB中实现,研究了齿侧间隙、时变刚度和综合啮合误差等因素对系统振动响应的影响。文中展示了如何利用ode45求解器解决非线性微分方程,并通过相图、频谱瀑布图等多种可视化手段分析了不同阻尼比下的系统行为。实验结果显示,适当的阻尼比能够有效抑制非线性振动,提高系统的稳定性。 适合人群:机械工程专业学生、从事齿轮设计与制造的技术人员以及对非线性动力学感兴趣的科研工作者。 使用场景及目标:适用于需要深入理解齿轮系统非线性振动机制的研究项目,旨在帮助工程师优化齿轮设计参数,提升机械设备的可靠性和使用寿命。 其他说明:文中提供了详细的MATLAB代码示例,便于读者复现实验结果。同时强调了数值仿真中的注意事项,如步长选择和参数设置,确保仿真结果的准确性。
1、该资源内项目代码经过严格调试,下载即用确保可以运行! 2、该资源适合计算机相关专业(如计科、人工智能、大数据、数学、电子信息等)正在做课程设计、期末大作业和毕设项目的学生、或者相关技术学习者作为学习资料参考使用。 3、该资源包括全部源码,需要具备一定基础才能看懂并调试代码。 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip 菜谱APP微信小程序实现源码.zip菜谱APP微信小程序实现源码.zip
# 基于Arduino和Python的温室蘑菇生长环境监控与控制系统 ## 项目简介 本项目致力于自动化温室环境控制,为蘑菇生长营造最优条件。借助Arduino收集温度、湿度、CO2浓度等环境数据,由Python脚本处理并存储至数据库,方便后续展示与分析。 ## 项目的主要特性和功能 1. 传感器数据采集运用BME280测湿度,DS18B20测堆肥和空气温度,MN Z19B测CO2浓度。 2. 继电器控制三个继电器分别调控空气温度、湿度和CO2浓度。 3. 数据处理与存储Arduino收集的数据经串口传至Python脚本处理,存入数据库。 4. 数据展示与分析通过Grafana可视化工具,展示时间序列数据、温度曲线等,可设警报级别。 5. 用户交互支持通过命令行交互向设备发送控制命令。 ## 安装使用步骤 1. 硬件连接连接Arduino、传感器、继电器和电源等硬件。
内容概要:本文详细介绍了利用MATLAB实现电动汽车负荷随机性下的蓄电池容量优化配置及其多时间尺度储能优化策略。首先,通过构建优化模型,考虑了电动汽车负荷的随机性和并网功率的波动性,旨在找到最佳的蓄电池容量和充放电功率配置。其次,采用了多目标灰狼算法进行求解,该算法通过初始化灰狼种群、迭代更新灰狼位置等步骤,最终得到优化结果。此外,还引入了多种数学工具如泊松分布、Beta分布等来模拟电动汽车的充电行为,并通过多时间尺度(月度、季度、年度)的约束处理,使得优化结果更加全面和实用。最后,展示了优化结果的可视化,特别是Pareto前沿图,帮助决策者在经济性和稳定性之间找到最佳平衡点。 适用人群:适用于从事电力系统研究、电动汽车充电设施规划、储能系统设计的研究人员和技术人员。 使用场景及目标:①用于研究电动汽车负荷随机性对电网的影响;②为电网规划者提供科学合理的蓄电池容量配置方案;③帮助决策者在经济性和稳定性之间做出最优选择。 其他说明:文中提供了详细的代码实现和解释,有助于读者理解和复现实验结果。同时,强调了模型的实际应用场景和工程价值,特别是在处理波动性和经济性之间的平衡方面。
内容概要:本文详细介绍了四种基于BP神经网络的回归预测模型(EWOA-BP、GA-BP、SSA-BP和传统BP)的实现与比较。首先,针对BP神经网络易陷入局部最优解的问题,引入了三种启发式优化算法:改进鲸鱼算法(EWOA)、遗传算法(GA)和麻雀搜索算法(SSA),分别用于优化BP神经网络的参数。文中展示了各个模型的数据预处理方法、具体实现步骤以及优化算法的关键代码片段。通过对多个评价指标(如R值、RMSE、MAE等)进行对比,验证了改进模型的有效性和优越性。此外,还提供了详细的实操建议和常见问题解决方案,帮助初学者快速上手。 适合人群:具有一定MATLAB编程基础,对机器学习尤其是神经网络感兴趣的科研人员、学生和技术爱好者。 使用场景及目标:适用于需要进行回归预测任务的研究项目,如房价预测、医疗数据分析等。通过对比不同优化算法的效果,选择最适合特定应用场景的模型,提高预测精度和稳定性。 其他说明:附带完整的代码包和数据接口,方便用户直接替换自己的数据集进行实验。建议使用MATLAB 2018b及以上版本,并确保安装了必要的工具箱。
内容概要:本文深入探讨了四桥臂三维空间矢量脉宽调制(3D-SVPWM)算法在电压型逆变器中的应用。首先介绍了四桥臂逆变器相较于传统三相逆变器的独特优势,即能够实现单桥臂电压的独立控制。接着详细解释了3D-SVPWM算法的工作原理,包括三维空间矢量的概念及其在逆变器输出电压控制中的应用。文中还提供了Python和Matlab的代码示例,展示了如何生成参考电压矢量并绘制负载电压波形。此外,重点讨论了负载电压的观察与分析,特别是在处理不对称负载时的表现。最后,强调了坐标变换、矢量选择以及占空比计算等关键技术细节,并通过实验数据验证了该算法的有效性和优越性能。 适合人群:从事电力电子、电机驱动、不间断电源等领域研究的技术人员和高校相关专业师生。 使用场景及目标:适用于需要深入了解四桥臂逆变器控制算法的研究人员和技术开发者,旨在帮助他们掌握3D-SVPWM算法的具体实现方法及其在实际应用中的表现。 其他说明:文章不仅提供了理论分析,还包括了大量的代码示例和实验结果,有助于读者更好地理解和应用该算法。
内容概要:本文详细介绍了光伏并网系统的仿真建模及其核心技术模块,包括Boost升压电路、三相逆变器、PLL锁相环以及MPPT控制策略。首先探讨了Boost电路的设计要点,如电感电流连续模式和参数设置;接着讲解了三相逆变器的SPWM生成和同步控制;然后深入分析了PLL锁相环的实现,尤其是Park变换和PI调节器的参数整定;最后讨论了MPPT的扰动观察法及其优化策略。此外,还涉及了dq解耦控制和电流内环电压外环控制的具体实现方法,并提供了多个MATLAB/Simulink代码片段用于辅助理解和实操。 适合人群:从事光伏并网系统研究和开发的技术人员,尤其是具有一定电力电子和控制系统基础知识的研发人员。 使用场景及目标:适用于希望深入了解光伏并网系统内部机制的研究人员和技术开发者,旨在帮助他们掌握各个模块的工作原理和仿真技巧,从而提高系统的性能和稳定性。 其他说明:文中不仅提供了详细的理论解释,还附带了大量的代码实例,便于读者进行实际操作和调试。同时,针对常见问题给出了具体的解决方案和调试建议,有助于解决实际工程中的难题。
初识网络 · udp的基本使用
报告:秋叶-2025年拥抱AI拥抱红利【PPT】-190页.pdf