`

关于SQL调优与报表的性能优化

 
阅读更多

前一段时间做了某产品实时统计的报表,这周在对报表性能进行优化。

其中逐步积累了一些优化经验,总结一下记录下来,欢迎大家一起探讨。

本文仅限于探讨单个数据库的查询sql及统计报表调优,不涉及分布式数据库架构或垂直、水平扩展等知识。

(本文中的统计数据库为Mysql)

 

一、SQL调优:

1、提升统计查询性能,首当其冲当然还是对查询SQL进行优化,说到SQL调优,不得不先说一下Mysql里SQL的执行顺序。网上查了一些资料,引用如下:

from -> (on -> join ->) where -> group by -> 聚集函数计算 -> having -> 计算所有表达式 ->  order by -> limit

2、SQL调优的基本思想:

Sql所需处理的资源总量/Sql单位时间所能处理的资源量=Sql执行时间  

(引用自:http://blog.163.com/hs_admin_jsjd/blog/static/175159035201031705956983/)

所以为减少Sql执行时间:

(1)可以增大Sql单位时间所能处理的资源量。

(2)可以减少Sql所需处理的资源总量。

要实现方法(1)一般需要提升硬件处理能力或对RDBMS进行优化。因此我们这里主要讨论方法(2)。即减少Sql所需处理的资源总量,就是减少执行sql所处理的行数。

3、如何减少Sql执行时所处理的行数?

参考了这个人下面的几篇blog,在实际工作中感觉确实比较有帮助,特此记录一下。

http://hideto.iteye.com/blog/218584 SQL性能调优(共3篇)

 

二、关于索引

经过了以上的SQL调优,查询的速度应该已经提升了不少,但是随着库表中的数据日渐增多,简单的SQL调优可能已经无法满足性能的需求,此时可以通过对表添加索引来加快查询速度。本次在优化过程中同样建立了索引和组合索引。下面是一些概念:

1、什么是索引?

索引类似于书的目录,主要用于提高查询效率,也就是按条件查询的时候,先查询索引,再通过索引找到相关的数据,索引相当于记录了对某个关键词,指定到不同的文件,或者文件里的不同位置,当然索引自身也是通过文件来保存的。(本段来源于网络)

2、建立索引。

但是同样不要超出需求创建索引,DBMS在插入、更新或删除行之后必须更新索引。随着表索引的增长,DBMS要花费越来越多的时间维护索引,行的修改速度也会越来越慢。

引用一列的索引称为简单索引,引用多列的索引称为组合索引。列的顺序在组合索引中是重要的。组合索引只作用于定义它的那组列,并非分别作用于每个列或相同列地其他顺序。

以上可以参考我另外一篇blog:http://shensy.iteye.com/blog/1486869 里面记录了一些关于使用索引的知识点。

3、关于索引类型(概念总结来源于网络)。

两种基本的索引结构,也就是索引文件的保存方式:

一个是顺序索引,就是根据值的顺序排序的(这个文件里面的值,也就是为其建索引的字段值,是顺序的放在索引文件里面)。

另外一个是散列索引,就是将值平均分配到若干散列桶中,通过散列函数定位的。

顺序索引中如果被索引的字段本身按照一定的顺序排序,那么这种索引叫做聚集索引,否则叫做非聚集索引。

如果被索引的字段的每个值都有一个索引与其对应,那么这种索引叫做稠密索引,否则叫做稀疏索引。

顺序索引分为两类,单级索引(不怎么用)和多级索引(通常是B+树,大量使用)。

 

B+树最常用,性能也不差,用于范围查询和单值查询都可以。特别是范围查询,非得用B+树这种顺序的才可以了。

HASH的如果只是对单值查询的话速度会比B+树快一点,但是ORACLE好像不支持HASH索引,只支持HASH表空间。

(参考资料:http://blog.csdn.net/coolzyt/article/details/4085678)

 

三、关于统计报表的性能优化

一般来说统计报表的查询SQL计算和关联关系都比较复杂,如果真的一句Sql查询出一张报表所需要的结果集其实是很耗时的(原来自己就干过这种事,一句Sql几十行,汗...)。其实对于报表,可以采用如下方法调优:

1、分页处理:

在左连接或子查询的最内层查询中使用LIMIT限制结果集大小,最大程度的保证后面对小结果集进行操作。

2、只查询基础数据:

在统计报表的查询SQL中有很多表达式计算或者需要连接多张其它表时,可以只查出需要计算的列后使用程序在内存中计算,或者只查出关联Id后,在程序中使用该Id到另一张表里再查一次(也方便使用Cache,见下文)。这样确实比一句Sql关联出所有结果集更快。

3、使用Cache:

如果分页后的结果集数量还是比较大,例如100条记录每页。那么如果将这100条记录中的某id拿出来到另外一张关联表里查一次的话,也就需要查100次,这其实也是比较耗时间的。即使用连接池进行单表sql查询,实践发现总用时也在1秒以上,毕竟每次重新连接也要消耗时间。所以,这里可以使用一些<K,V>的缓存来减少到数据库中查询的次数,例如memcached或redis等...但是这也加大了程序的复杂度,比如设计缓存粒度的大小(对某列缓存还是对整个报表结果缓存)、同步缓存内容的时机以及失效时间等多方面的问题。不过如果使用得当的话,确实可以提升不少统计报表的查询性能。

4、尽量不使用跨库join:

在Mysql中提供了一个跨库join的功能,就是查询sql中将表名前面加数据库名:dbname.tablename的形式,即可关联另外一个数据库中的表了。这个跨库join对于那些sql简单且表数量小的查询确实很方便,但是对于数据量大的表,而且比较复杂的SQL查询就比较费时了,不建议使用。实际工作中我使用了定时程序把另外一个库表中需要的列加载到统计库的一张表内,然后再直接join统计库中的表来实现避免跨库join。

 

PS:

SQL优化续篇 http://shensy.iteye.com/blog/1887786

 

分享到:
评论

相关推荐

    基于Matlab的三相逆变器SPWM调制仿真及波形分析

    内容概要:本文详细介绍了利用Matlab进行三相逆变器SPWM调制仿真的全过程。首先明确了将110V直流电转换为220V/50Hz交流电的需求,接着阐述了SPWM调制的基本原理及其MATLAB代码实现方法,包括载波频率、调制比的选择以及三相调制信号的生成。文中还展示了逆变桥的Simulink模型搭建步骤,强调了关键参数如死区时间和LC滤波器的设计要点。通过对输出电压、电流波形的分析,验证了模型的有效性和稳定性,并提供了调参技巧和常见问题解决方案。 适合人群:从事电力电子、新能源系统研究的技术人员及高校相关专业师生。 使用场景及目标:适用于希望深入了解SPWM调制机制、掌握三相逆变器设计与优化方法的研究者;可用于教学实验、项目开发和技术培训等场合。 其他说明:文中提供的完整代码和详细的注释有助于初学者快速入门,而丰富的波形分析则为进阶用户提供宝贵的参考资料。此外,作者还分享了一些实用的小贴士,如如何避免常见的错误配置,确保仿真的顺利进行。

    Android5.3 Android 组件-基础控件-例子-broadcast图片

    Android5.3 Android 组件-基础控件-例子-broadcast图片

    基于MATLAB的风光场景生成与削减:概率距离快速削减法的应用

    内容概要:本文详细介绍了如何使用MATLAB实现风光场景生成与削减,特别是在处理风电和光伏发电的不确定性方面。文章首先解释了风光场景生成的概念,即通过蒙特卡洛方法模拟各种可能的风电和光伏出力情况。接着,针对生成的大量场景可能导致计算复杂的问题,提出了基于概率距离的快速削减法,通过计算场景间的概率距离,将大量场景削减至少数关键场景,从而简化后续计算。文中还展示了具体的MATLAB代码实现,包括场景生成、距离计算、场景削减等关键步骤,并讨论了一些优化技巧如并行计算、数据标准化等。此外,文章强调了该方法在电力系统调度中的重要性和实用性,能够有效提高计算效率和准确性。 适合人群:从事电力系统研究的科研人员、工程师及相关领域的学生。 使用场景及目标:适用于需要处理风电、光伏等可再生能源出力不确定性的电力系统调度和优化项目。主要目标是通过减少计算复杂度,提高调度模型的计算效率和准确性。 其他说明:文中提供的MATLAB代码具有良好的可移植性和复用性,可以根据具体应用场景进行适当修改和扩展。

    毕业设计(论文) 直动式液压往复泵设计说明书.doc.doc

    毕业设计(论文) 直动式液压往复泵设计说明书.doc.doc

    电动剃须刀的结构设计说明书.docx.docx

    电动剃须刀的结构设计说明书.docx.docx

    【深度学习应用】DeepSeek智能模型的万能提问模板设计:提升问题解决效率与准确性

    内容概要:本文介绍了DeepSeek这一开源深度学习模型的使用方法和提问技巧。DeepSeek不仅能够执行指令,还能进行思考和推理。文章提出了几种提问模板,帮助用户更有效地利用DeepSeek解决问题。其中包括“背景+需求+约束条件”、“身份+任务+要求+例子”、“我要做什么→要做什么用→希望达到什么效果→但担心什么问题”、“需求+担忧+反向验证”、“问题+追问预期+调整方向”以及“目标+条件+验证方式”。每种模板都配有详细的解释和示例,以指导用户如何构建问题,从而获得更有针对性的答案。 适合人群:适合对深度学习感兴趣的开发者、研究人员以及希望通过DeepSeek解决实际问题的用户。 使用场景及目标:①帮助用户更好地理解和使用DeepSeek,提高问题解决效率;②通过具体的提问模板,让用户能够更精准地获取所需信息;③适用于各种场景,包括但不限于技术问题解答、学习计划制定、课程推广方案设计等。 其他说明:为了充分利用DeepSeek的功能,用户在提问时应尽量提供详尽的背景信息,明确需求,并根据实际情况设置合理的约束条件。此外,用户还可以通过设定角色和任务,让DeepSeek从特定角度进行思考,从而得到更具创意和实用性的解决方案。

    时间序列预测中SVM、BP神经网络与LSTM的应用及MATLAB实现

    内容概要:本文详细介绍了支持向量机(SVM)、BP神经网络和LSTM网络在时间序列预测中的应用及其MATLAB实现。首先,针对SVM部分,文章讲解了如何将时间序列数据转化为特征矩阵并通过滑动窗口进行预测,强调了交叉验证的重要性。对于BP神经网络,则着重于数据归一化以及网络结构的选择,并指出BP网络容易陷入局部最优的问题。最后,在LSTM部分,文章展示了如何利用MATLAB的深度学习工具箱实现LSTM网络,解决了输入数据格式转换的问题,并实现了滚动预测。文中提供了具体的代码示例,确保读者能够轻松替换数据源并运行程序。 适用人群:适用于有一定MATLAB基础的时间序列预测初学者和技术爱好者。 使用场景及目标:帮助读者掌握三种不同类型的机器学习模型在时间序列预测任务中的具体应用,理解各自的特点和优缺点,从而选择合适的模型应用于实际项目中。 其他说明:文章不仅提供了详细的理论解释,还给出了完整的代码实现,使得读者可以直接上手实践。同时,作者提醒了一些常见的错误和注意事项,如数据格式、归一化等问题,有助于提高预测准确性。

    (精品)热转印制作人物主题个性杯子毕业论文设计说明书.doc

    (精品)热转印制作人物主题个性杯子毕业论文设计说明书.doc

    5000吨年氧化羰化制碳酸二甲酯合成工艺设计说明书.doc

    5000吨年氧化羰化制碳酸二甲酯合成工艺设计说明书.doc

    3D文件可爱小鹿3D建模,可爱小鹿建模仿真,小鹿仿真设计,3D打印文件,免费下载

    【3D文件】可爱小鹿3D建模,3D打印文件,免费下载 资源图片查看链接:https://blog.csdn.net/weixin_60324241/article/details/147233616?spm=1011.2415.3001.5331 欢迎查看下载

    基于Simulink的BUCK变换器与BLDCM控制系统设计及优化

    内容概要:本文详细介绍了如何利用Simulink进行BUCK变换器的电压电流双闭环控制以及多相控制的设计方法,并探讨了无刷直流电机(BLDCM)控制系统的构建。文中不仅涵盖了基本的控制理论,还提供了具体的MATLAB/Simulink代码示例,帮助读者理解和实现复杂的电力电子控制系统。对于常见的调试问题,如代数环错误、谐波失真、电流不平衡等,作者分享了许多实践经验和技术技巧。 适合人群:从事电力电子、自动化控制领域的工程师和技术人员,尤其适用于有一定Simulink基础并希望深入掌握BUCK变换器和BLDCM控制设计的专业人士。 使用场景及目标:① 学习如何在Simulink中搭建和优化BUCK变换器的电压电流双闭环控制系统;② 掌握多相BUCK变换器的均流控制策略;③ 实现BLDCM的高效换相逻辑和速度环参数整定;④ 解决仿真过程中可能出现的各种问题。 其他说明:文章强调了实际应用中的注意事项,如参数选择、模块配置、信号处理等方面的经验,有助于提高仿真的准确性和效率。同时提醒读者关注硬件保护措施,避免实验过程中损坏设备。

    基于粒子群算法的电力系统经济调度模型研究 - IEEE30节点六机系统的优化实现

    内容概要:本文详细介绍了如何利用粒子群优化(PSO)算法解决电力系统经济调度问题,特别是在IEEE30节点六机系统中的应用。文章首先解释了关键参数的选择及其意义,如最大迭代次数、惯性权重、学习因子等。接着深入探讨了适应度函数的设计,包括火电成本计算、失负荷惩罚以及弃风弃光惩罚。此外,还讨论了重要的约束处理方法,如爬坡速率限制和出力上下限截断。通过这些措施,实现了对六个发电机组的智能调度,使得总发电成本最小化,同时保证了系统的稳定性和可靠性。实验结果显示,相比传统调度方案,新方法使总成本降低了12.7%,弃风弃光量控制在5%以内。 适合人群:从事电力系统调度、优化算法研究的专业人士,尤其是对智能算法应用于能源管理感兴趣的工程师和技术研究人员。 使用场景及目标:适用于希望提高电力系统经济效益和环境效益的企业和个人。主要目标是在满足电力需求的前提下,减少化石燃料消耗,增加可再生能源利用率,从而达到节能减排的目的。 其他说明:文中提供的代码片段仅为示意,具体实现时还需考虑更多实际情况,如不同类型的发电机组特性、精确的气象预测数据等。此外,尽管PSO算法表现良好,但在某些极端情况下仍可能存在局限性,因此建议结合其他优化手段共同使用。

    基于MATLAB的楼宇负荷需求响应研究:模型预测控制与完全复现

    内容概要:本文详细介绍了如何使用MATLAB和CVX工具箱,通过模型预测控制(MPC)优化楼宇空调系统的能耗管理。首先,作者通过对建筑热力学特性的建模,建立了状态空间模型来描述楼宇的温度变化规律。接着,设计了一个24小时预测时域的MPC控制器,结合动态电价信号,实现了在电价低谷期预冷建筑并在电价高峰期减少制冷功率的目标。文中展示了具体的MATLAB代码片段,解释了关键参数的选择及其物理意义,并讨论了如何通过引入舒适度约束和反馈校正机制提高控制精度。最终,仿真实验表明该方法不仅能够显著降低电费支出,还能保持室内温度在舒适的范围内。 适合人群:从事楼宇自动化、能源管理和控制系统设计的研究人员和技术人员。 使用场景及目标:适用于商业建筑和工业园区的空调系统节能改造项目,旨在通过智能化控制手段实现节能减排和成本优化。 其他说明:文章强调了模型简化与计算效率之间的权衡,以及在实际应用中需要根据不同建筑物的具体情况进行参数调整。同时指出,良好的用户体验是衡量控制算法成功与否的重要标准之一。

    基于CANoe的Bootloader上位机软件开发:飞思卡尔MC9S12G128MLL的应用与优化

    内容概要:本文详细介绍了基于CANoe的Bootloader上位机软件开发流程及其应用,重点在于飞思卡尔MC9S12G128MLL这款16位单片机。首先解释了选择CANoe的原因,因其强大的CAN总线仿真能力和灵活的数据格式定义,非常适合Bootloader开发。接着深入探讨了下位机MC9S12G128MLL的基本配置,包括系统时钟、端口初始化以及CAN模块的设置。随后展示了具体的CAN报文收发实现方法,如通过CAPL语言编写上位机发送命令,下位机接收并处理这些命令,从而实现进入Bootloader模式的功能。此外还讨论了进一步的功能扩展,如程序下载、校验等复杂操作的设计思路和技术细节。最后强调了实际开发过程中遇到的问题及解决方案,例如Flash擦写、通信协议设计、CRC校验等方面的经验教训。 适合人群:从事嵌入式系统开发的技术人员,尤其是专注于汽车电子领域CAN总线相关项目的工程师。 使用场景及目标:适用于需要开发或优化基于CANoe的Bootloader上位机软件的项目,旨在提高嵌入式系统的升级效率和可靠性,确保在复杂环境下能够顺利完成固件更新任务。 其他说明:文中不仅提供了详细的理论讲解,还包括大量实用的代码示例,帮助读者更好地理解和掌握具体实施步骤。同时,作者分享了许多宝贵的实践经验,有助于避免常见错误,提升开发成功率。

    dwaDWADWAWADWAWDADWADWA

    dwaDWADWAWADWAWDADWADWA

    基于S7-300 PLC与组态王的散装水泥生产线在线称重控制系统设计与实现

    内容概要:本文详细介绍了利用西门子S7-300 PLC和组态王软件构建散装水泥生产线在线称重控制系统的全过程。首先阐述了硬件配置,包括CPU315-2DP作为主站、ET200M分布式从站以及SM331模拟量模块用于接收称重传感器信号。接着深入解析了梯形图程序的关键部分,如OB35中断组织块用于每100ms采集一次重量数据,并采用浮点数比较器实时判断重量变化趋势。此外,还讨论了组态王的画面设计,包括实时重量显示、趋势图控件的应用以及报警机制的设置。文中特别强调了针对动态称重过程中信号跳变的问题采取了移动平均滤波算法进行优化,并分享了一些实际工程中的经验和教训,如正确的接线方式、抗干扰措施等。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是那些对PLC编程、组态软件应用有一定基础的人群。 使用场景及目标:适用于新建或改造散装水泥生产线的称重控制系统项目。主要目标是提高称重精度,确保生产效率的同时保障产品质量。通过学习本文可以掌握完整的系统设计方案,包括硬件选型、软件编程及人机界面设计等方面的知识。 其他说明:文中提供了大量具体的代码片段和配置细节,有助于读者更好地理解和实施相关技术。同时,作者结合自身经验给出了许多宝贵的建议,对于初学者来说非常有价值。

    基于三菱FX3U PLC与MCGS触摸屏的四路抢答器控制系统设计与实现

    内容概要:本文详细介绍了使用三菱FX3U PLC和MCGS触摸屏构建四路抢答器控制系统的全过程。首先明确了系统的硬件组成,包括PLC、触摸屏以及四个抢答台的按钮和指示灯。接着阐述了IO分配的具体细节,如输入输出端口的功能定义。然后深入讲解了梯形图程序的设计思路,特别是抢答锁存和互锁逻辑的实现方法。此外,还讨论了接线图原理图的关键要点,如限流电阻的选择和公共端的处理。最后介绍了MCGS组态画面的设计技巧,包括状态指示灯的颜色变化、得分统计等功能。文中还提到了一些常见的调试问题及其解决方案,如按钮触点抖动引起的误触发和指示灯闪烁问题。 适合人群:对PLC编程和工业自动化感兴趣的初学者,尤其是希望深入了解三菱PLC应用的技术人员。 使用场景及目标:适用于需要设计和实现简单但完整的PLC控制系统的场合,帮助读者掌握PLC编程的基本技能,提高实际动手能力。 其他说明:文章提供了详细的梯形图代码和接线图示例,便于读者理解和实践。同时强调了一些实用的小技巧,如防作弊机制和硬件消抖措施,有助于提升系统的可靠性和稳定性。

    预防沉迷网络安全教育主题班会专业知识讲座.ppt

    预防沉迷网络安全教育主题班会专业知识讲座.ppt

    基于S7-200 PLC与MCGS组态的灌装生产线控制系统详解

    内容概要:本文详细介绍了基于西门子S7-200 PLC和MCGS组态软件构建的灌装生产线系统的具体实现方法和技术细节。主要内容涵盖IO分配、接线图原理、梯形图程序设计、组态画面设计以及常见问题的解决方案。文中通过具体的实例展示了如何利用PLC进行逻辑控制,确保生产过程中各个环节的安全性和准确性。同时,还探讨了如何优化传感器信号处理、提高系统稳定性和调试技巧。 适合人群:从事工业自动化领域的工程师和技术人员,尤其是对PLC编程和组态软件有一定了解的人群。 使用场景及目标:适用于食品饮料行业的灌装生产线自动化控制项目。主要目标是帮助技术人员理解和掌握PLC与组态软件的联合应用,提高生产线的效率和可靠性。 其他说明:文章提供了丰富的实践经验,包括硬件接线注意事项、软件编程技巧以及故障排除方法,为实际工程应用提供了宝贵的参考资料。

    基于西门子S7-1200 PLC的小区换热站自动控制系统:流量与温度的精准调控及解决方案

    内容概要:本文详细介绍了基于西门子S7-1200 PLC构建的小区换热站自动控制系统的设计与实施。主要内容涵盖IO分配、流量和温度控制的具体实现方法,特别是针对流量计和电动阀的配合、PID闭环控制的应用以及温度前馈补偿等关键技术点进行了深入探讨。此外,文中还分享了多个调试过程中遇到的实际问题及其解决方案,如温度漂移、阀门响应延迟、模拟量模块干扰等问题。通过合理的硬件配置和软件优化,实现了系统的稳定运行,显著减少了热力公司的维护成本。 适合人群:从事工业自动化控制领域的工程师和技术人员,尤其是对PLC编程和换热站自动化感兴趣的从业者。 使用场景及目标:适用于新建或改造小区换热站项目的规划与实施,旨在提高供暖系统的效率和稳定性,减少人为干预,确保居民冬季取暖的安全性和舒适性。 其他说明:文章不仅提供了详细的编程实例和电路连接图,还强调了实际应用中的注意事项和经验教训,对于理解和掌握类似项目的开发具有重要参考价值。

Global site tag (gtag.js) - Google Analytics