问题描述:
有一个查询如下,去掉
TOP 1
的时候,很快就出来结果了,但加上
TOP 1
的时候,一般要
2~3
秒才出数据,何解?
SELECT
TOP
1
A.
INVNO
FROM
A,
B
WHERE
A.
Item =
B.
ItemNumber
AND
B.
OwnerCompanyCode IS
NOT
NULL
问题原因分析:
在使用
TOP 1
的时候,
SQL Server
会尽力先找出这条
TOP 1
的记录,这就导致它采用了与不加
TOP
时不一致的扫描算法,
SQL Server
查询优化器始终认为,应该可以比较快的找到匹配的第
1
条记录,所以一般是使用嵌套循环的联接,则不加
TOP 1
时,
SQL Server
会根据结构和数据的统计信息决策出联接策略。
嵌套循环一般适用于联系的两个表,一个表的数据较大,而另一个表的数据较小的情况
,如果查询匹配的值出现在扫描的前端,则在取
TOP 1
的情况下,是符合嵌套循环联系的使用条件的,但当匹配的数据出现在扫描的后端,或者是基本上没有匹配的数据时,则嵌套循环要扫描完成两个大表,这显然是不适宜的,也正是因为这种情况,导致了
TOP 1
比不加
TOP 1
的效率慢很多
关于此问题的模拟环境:
USE
tempdb
GO
SET
NOCOUNT
ON
--======================================
--
创建测试环境
--======================================
RAISERROR
(
'
创建测试环境
'
,
10,
1)
WITH
NOWAIT
-- Table A
CREATE
TABLE
[dbo].
A(
[TranNumber] [int] IDENTITY
(
1,
1)
NOT
NULL,
[INVNO] [char](
8)
NOT
NULL,
[ITEM] [char](
15)
NULL
DEFAULT
(
''
),
PRIMARY
KEY
(
[TranNumber])
)
CREATE
INDEX
[indexONinvno] ON
[dbo].
A(
[INVNO])
CREATE
INDEX
[indexOnitem] ON
[dbo].
A (
[ITEM])
CREATE
INDEX
[indexONiteminnvo] ON
[dbo].
A(
[INVNO],
[ITEM])
GO
-- Table B
CREATE
TABLE
[dbo].
B(
[ItemNumber] [char](
15)
NOT
NULL
DEFAULT
(
''
),
[CompanyCode] [char] (
4)
NOT
NULL,
[OwnerCompanyCode] [char](
4)
NULL,
PRIMARY
KEY
(
[ItemNumber],
[CompanyCode])
)
CREATE
INDEX
[ItemNumber] ON
[dbo].
B(
[ItemNumber])
CREATE
INDEX
[CompanyCode] ON
[dbo].
B(
[CompanyCode])
CREATE
INDEX
[OwnerCompanyCode] ON
[dbo].
B(
[OwnerCompanyCode])
GO
--======================================
--
生成测试数据
--======================================
RAISERROR
(
'
生成测试数据
'
,
10,
1)
WITH
NOWAIT
INSERT
[dbo].
A(
[INVNO],
[ITEM])
SELECT
LEFT(
NEWID
(),
8),
RIGHT(
NEWID
(),
15)
FROM
syscolumns A,
syscolumns B
INSERT
[dbo].
B(
[ItemNumber],
[CompanyCode],
[OwnerCompanyCode])
SELECT
RIGHT(
NEWID
(),
15),
LEFT(
NEWID
(),
4),
LEFT(
NEWID
(),
4)
FROM
syscolumns A,
syscolumns B
GO
速度测试脚本:
--======================================
--
进行查询测试
--======================================
RAISERROR
(
'
进行查询测试
'
,
10,
1)
WITH
NOWAIT
DECLARE
@dt DATETIME
,
@id int
,
@loop int
DECLARE
@ TABLE
(
id int
IDENTITY
,
[TOP 1] int
,
[WITHOUT TOP] int
)
SET
@loop =
0
WHILE
@loop <
10
BEGIN
SET
@loop =
@loop +
1
RAISERROR
(
'test %d'
,
10,
1,
@loop)
WITH
NOWAIT
SET
@dt =
GETDATE
()
SELECT
TOP
1
A.
INVNO
FROM
A,
B
WHERE
A.
Item =
B.
ItemNumber
AND
B.
OwnerCompanyCode IS
NOT
NULL
INSERT
@([TOP 1])
VALUES
(
DATEDIFF
(
ms,
@dt,
GETDATE
()))
SELECT
@id =
SCOPE_IDENTITY
(),
@dt =
GETDATE
()
SELECT
--TOP 1
A.
INVNO
FROM
A,
B
WHERE
A.
Item =
B.
ItemNumber
AND
B.
OwnerCompanyCode IS
NOT
NULL
UPDATE
@ SET
[WITHOUT TOP] =
DATEDIFF
(
ms,
@dt,
GETDATE
())
WHERE
id =
@id
END
SELECT
*
FROM
@
UNION
ALL
SELECT
NULL,
SUM
(
[TOP 1]),
SUM
(
[WITHOUT TOP])
FROM
@
GO
测试数据的变更脚本:
DECLARE
@value char
(
15),
@value1 char
(
15)
SELECT
@value =
LEFT(
NEWID
(),
15),
@value1 =
LEFT(
NEWID
(),
15)
UPDATE
A
SET
Item =
@value
FROM
A
INNER
JOIN(
SELECT
TOP
1
[TranNumber]
FROM
(
SELECT
TOP
20
PERCENT
[TranNumber]
FROM
A
ORDER
BY
[TranNumber]
)
AA
ORDER
BY
[TranNumber] DESC
)
B
ON
A.
[TranNumber] =
B.
[TranNumber]
UPDATE
B
SET
ItemNumber =
@value
FROM
B
INNER
JOIN(
SELECT
TOP
1
[ItemNumber],
[CompanyCode]
FROM
(
SELECT
TOP
20 PERCENT
[ItemNumber],
[CompanyCode]
FROM
B
ORDER
BY
[ItemNumber],
[CompanyCode]
)
BB
ORDER
BY
[ItemNumber] DESC
,
[CompanyCode] DESC
)
B1
ON
B.
[ItemNumber] =
B1.
[ItemNumber]
AND
B.
[CompanyCode] =
B1.
[CompanyCode]
GO
测试说明:
1.
在刚建立好测试环境的时候,是没有任何匹配项的,这时候,
TOP 1
会扫描两个表的所有数据,运行“速度测试脚本
”可以看到此时有无
TOP 1
的效率差异:
TOP 1
明显比不加
TOP
慢
2.
修改“测试数据的变更脚本
”中,红色的
20
,
让匹配的数据出现在扫描的顶端、中间和尾端,分别使用
“速度测试脚本
”测试,可以看到,匹配的值靠近扫描的前端的时候,
TOP 1
比不加
TOP
快,随着匹配数据很后端的推移,这种效率差异会越来越小,到后面就变成
TOP 1
比不加
TOP 1
慢。
注意:
每次变更数据,并且完成“速度测试脚本
”测试后,需要修改“测试数据的变更脚本
”中,红色的
@
value
为
@value1
,让刚才设置匹配的数据再变回为不匹配
附:联接的几种方式
嵌套循环联接也称为
“
嵌套迭代
”
,它将一个联接输入用作外部输入表(显示为图形执行计划中的顶端输入),将另一个联接输入用作内部(底端)输入表。外部循环逐行处理外部输入表。内部循环会针对每个外部行执行,在内部输入表中搜索匹配行。
最简单的情况是,搜索时扫描整个表或索引;这称为
“
单纯嵌套循环联接
”
。如果搜索时使用索引,则称为
“
索引嵌套循环联接
”
。如果将索引生成为查询计划的一部分(并在查询完成后立即将索引破坏),则称为
“
临时索引嵌套循环联接
”
。查询优化器考虑了所有这些不同情况。
如果外部输入较小而内部输入较大且预先创建了索引,则嵌套循环联接尤其有效。在许多小事务中(如那些只影响较小的一组行的事务),索引嵌套循环联接优于合并联接和哈希联接。但在大型查询中,嵌套循环联接通常不是最佳选择。
合并联接要求两个输入都在合并列上排序,而合并列由联接谓词的等效
(ON)
子句定义。通常,查询优化器扫描索引(如果在适当的一组列上存在索引),或在合并联接的下面放一个排序运算符。在极少数情况下,虽然可能有多个等效子句,但只用其中一些可用的等效子句获得合并列。
由于每个输入都已排序,因此
Merge Join
运算符将从每个输入获取一行并将其进行比较。例如,对于内联接操作,如果行相等则返回。如果行不相等,则废弃值较小的行并从该输入获得另一行。这一过程将重复进行,直到处理完所有的行为止。
合并联接操作可以是常规操作,也可以是多对多操作。多对多合并联接使用临时表存储行。如果每个输入中有重复值,则在处理其中一个输入中的每个重复项时,另一个输入必须重绕到重复项的开始位置。
如果存在驻留谓词,则所有满足合并谓词的行都将对该驻留谓词取值,而只返回那些满足该驻留谓词的行。
合并联接本身的速度很快,但如果需要排序操作,选择合并联接就会非常费时。然而,如果数据量很大且能够从现有
B
树索引中获得预排序的所需数据,则合并联接通常是最快的可用联接算法。
哈希联接有两种输入:生成输入和探测输入。查询优化器指派这些角色,使两个输入中较小的那个作为生成输入。
哈希联接用于多种设置匹配操作:内部联接;左外部联接、右外部联接和完全外部联接;左半联接和右半联接;交集;联合和差异。此外,哈希联接的某种变形可以进行重复删除和分组,例如
SUM(salary) GROUP BY department
。这些修改对生成和探测角色只使用一个输入。
以下几节介绍了不同类型的哈希联接:内存中的哈希联接、
Grace
哈希联接和递归哈希联接。
内存中的哈希联接
哈
希联接先扫描或计算整个生成输入,然后在内存中生成哈希表。根据计算得出的哈希键的哈希值,将每行插入哈希存储桶。如果整个生成输入小于可用内存,则可以
将所有行都插入哈希表中。生成阶段之后是探测阶段。一次一行地对整个探测输入进行扫描或计算,并为每个探测行计算哈希键的值,扫描相应的哈希存储桶并生成
匹配项。
Grace
哈希联接
如果生成输入大于内存,哈希联接将分为几步进行。这称为
“Grace
哈希联接
”
。
每一步都分为生成阶段和探测阶段。首先,消耗整个生成和探测输入并将其分区(使用哈希键上的哈希函数)为多个文件。对哈希键使用哈希函数可以保证任意两个
联接记录一定位于相同的文件对中。因此,联接两个大输入的任务简化为相同任务的多个较小的实例。然后将哈希联接应用于每对分区文件。
递归哈希联接
如果生成输入非常大,以至于标准外部合并的输入需要多个合并级别,则需要多个分区步骤和多个分区级别。如果只有某些分区较大,则只需对那些分区使用附加的分区步骤。为了使所有分区步骤尽可能快,将使用大的异步
I/O
操作以便单个线程就能使多个磁盘驱动器繁忙工作。
border: 1pt solid #dedfef; padding: 0cm
分享到:
Global site tag (gtag.js) - Google Analytics
|
相关推荐
1. 高效率:TOP264vg规格书能够提供极高的能效,在265 VAC输入时空载功耗低于100 mW,在230 VAC输入时输入功率为1 W时,待机输出功率高达750 mW。 2. 多模式PWM控制技术:TOP264vg规格书采用多模式PWM控制技术,...
1. **数据采集**:源码会展示`top`是如何通过系统调用来获取实时的系统状态信息,如`/proc`文件系统中的信息。 2. **进程调度**:`top`如何对进程进行排序,以及如何根据不同的参数(如CPU使用率、内存使用量等)...
1. **进程信息获取**:`top`命令通过`/proc`文件系统获取系统和进程的信息。`/proc`是一个虚拟文件系统,它提供了运行时进程的状态信息。源码会解析这些文件以获取CPU使用率、内存使用情况、进程ID等。 2. **CPU和...
(45, 1), (3, 1), (78, 1), (456, 1), (70, 1), (1, 1), (999, 1) ``` 2. **Shuffle阶段**: - Map阶段的输出被分割并按照键进行排序,确保相同键的值被分发到同一个Reducer。在这个例子中,所有相同的数字会...
文档是解决鼎捷TIPTOP GP以及T100 POI导出EXCEL的时候需要在字段里面加超链接。我这个案例是用于加网页链接,后期要是EXCEL页面内跳转也可以参考。
top 源代码top 源代码top 源代码top 源代码top 源代码top 源代码
鼎捷ERP tiptop TOPGP5.3数据库字典
1. 驱动安装程序:这是将TOP853编程驱动器软件安装到用户计算机上的文件,通常为.exe或.msi格式。 2. 用户手册:详细解释如何使用TOP853编程驱动器,包括连接设备、配置参数、编程步骤等。 3. 驱动更新程序:用于...
1、按之上的连接把top-3.6-sol9-sparc-local.gz存在你的机器上,并上传到服务器.我把它传到了/tmp/yang这个目录。 sun480-1#[/tmp/yang]ls -l 总数 432 -rw-r--r-- 1 root other 215455 6月 21 15:08 top-3.6-sol9...
TIPTOP ERP不完全实施开发手册,里面有常用linux命令,TIPTOP、JAVA、jsp、oracle常用命令
1. 接口设计:TIPTOP系统可能会为外部系统提供一系列API,这些API通过Web Service的形式公开,允许外部系统按照定义的接口调用TIPTOP的功能。 2. 安全性:为了确保数据安全,接口通常会实施身份验证和授权机制,如...
《深入解析top命令:探索top-3.8beta1源代码》 在Linux系统中,top命令是一个实时显示系统状态的动态视图工具,它能够提供关于系统资源使用情况的实时监控,包括CPU使用率、内存占用、进程状态等关键信息。当我们...
1. **安装TopSDK**:你需要将TopSDK的NuGet包导入到你的C#项目中。在Visual Studio中,可以通过NuGet包管理器找到并安装"Alibaba.Taobao.SDK.Core"。 2. **初始化配置**:在代码中,你需要创建一个`...
其次,在SMT封装中,TOP LAYER和TOP PASTE是同样大小的,而TOP SOLDER则比它们稍微大一圈,因为TOP SOLDER是为了匹配焊盘,是自动产生的。在PCB板设计时,阻焊层上默认会有SOLDER层,因此焊接面的焊盘部分是上了银白...
这个就不解释了,不懂的朋友查询下top的帮助文档。这里要实现的是通过python调用top命令,并获得cpu的利用率信息。 用过popen的朋友很快就能想到类似如下的代码(这个是我第一次写的代码,*_*): 复制代码 代码如下...
1. 原始图像文件,可能是.jpg、.png或.mat格式,用于演示Tophat变换前的图像状态。 2. 处理后的图像文件,同样可能是.jpg、.png或.mat格式,展示了Tophat变换的效果。 3. MATLAB代码文件,可能是.m文件,实现了Top...
【标题】"托普Top编程器软件8.82"是指一种专用于编程微控制器的软件工具,由托普公司开发。这个版本是8.82,表明它是该软件的一个更新迭代,通常会包含错误修复、性能提升以及可能的新功能。 【描述】提到的“支持...
【标题】"TOP851编程器软件"指的是专门用于编程和烧录TOP851型号编程器的软件工具。这种编程器常被用于电子工程领域,尤其是对微控制器(MCU)进行编程,比如8位或16位的单片机。在描述中提到,该软件适用于较旧的...
尽管如此,对于某些老款设备的维护和修复,或者对经典硬件的爱好者来说,TOP 851这类软件仍然是不可或缺的资源。 在提供的文件列表中,“top851v53.exe”可能是TOP 851软件的安装程序,版本为5.3。这表明用户可以...
该报告涵盖了 Web 应用程序安全的十个最常见的风险,包括失效的访问控制、加密机制失效、注入、不安全设计、安全配置错误、自带缺陷和过时的组件、身份识别和身份验证错误、软件和数据完整性故障、安全日志和监控...