SQLServer Execpt和not in 性能區(qū)別
更新時間:2012年01月20日 22:42:57 作者:
網(wǎng)上有很多 except 和 not in的返回結(jié)果區(qū)別這里就就提了
主要講 except 和 not in 的性能上的區(qū)別。
CREATE TABLE tb1(ID int)
CREATE TABLE tb2(ID int)
BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i -1
end
COMMIT我測試的時候tb1 是1000,tb2 是500
DBCC FREESYSTEMCACHE ('ALL','default');
SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF
執(zhí)行計劃:
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
|--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
|--Table Scan(OBJECT:([master1].[dbo].[tb1]))
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
|--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
|--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Nested Loops(Left Anti Semi Join)
|--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
| |--Top(TOP EXPRESSION:((1)))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Row Count Spool
|--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
(500 行受影響)
表 'tb1'。掃描計數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 1,邏輯讀取 1 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(6 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 528 毫秒。
(500 行受影響)
表 'Worktable'。掃描計數(shù) 0,邏輯讀取 0 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 3,邏輯讀取 1002 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb1'。掃描計數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(10 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 16 毫秒,占用時間 = 498 毫秒。
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
結(jié)論:通過較多數(shù)據(jù) 和 較少數(shù)據(jù)的測試,在較少數(shù)據(jù)的情況下 not in 比 except 性能好,但是在較多數(shù)據(jù)情況下 execpt 比 not in 出色。
看執(zhí)行計劃可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的執(zhí)行計劃開可以得到優(yōu)化。
如果大家有興趣可以看看 not exists 的執(zhí)行計劃。建議:
大家不要迷信測試結(jié)果,因為所有的性能都是和執(zhí)行計劃密切相關(guān)的。而執(zhí)行計劃和統(tǒng)計數(shù)據(jù)又密不可分。
所以過度的迷信測試結(jié)果,可能會對生產(chǎn)庫造成性能的影響達不到預期的性能效果。
復制代碼 代碼如下:
CREATE TABLE tb1(ID int)
CREATE TABLE tb2(ID int)
BEGIN TRAN
DECLARE @i INT = 500
WHILE @i > 0
begin
INSERT INTO dbo.tb1
VALUES ( @i -- v - int
)
SET @i = @i -1
end
COMMIT我測試的時候tb1 是1000,tb2 是500
復制代碼 代碼如下:
DBCC FREESYSTEMCACHE ('ALL','default');
SET STATISTICS IO ON
SET STATISTICS TIME on
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
SET STATISTICS IO OFF
SET STATISTICS TIME OFF
執(zhí)行計劃:
復制代碼 代碼如下:
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2;
|--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC))
|--Table Scan(OBJECT:([master1].[dbo].[tb1]))
復制代碼 代碼如下:
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值
|--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID]))
|--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Nested Loops(Left Anti Semi Join)
|--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL))
| |--Table Scan(OBJECT:([master1].[dbo].[tb1]))
| |--Top(TOP EXPRESSION:((1)))
| |--Table Scan(OBJECT:([master1].[dbo].[tb2]))
|--Row Count Spool
|--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL))
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
(500 行受影響)
表 'tb1'。掃描計數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 1,邏輯讀取 1 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(6 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 528 毫秒。
(500 行受影響)
表 'Worktable'。掃描計數(shù) 0,邏輯讀取 0 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 3,邏輯讀取 1002 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
表 'tb1'。掃描計數(shù) 1,邏輯讀取 2 次,物理讀取 0 次,預讀 0 次,lob 邏輯讀取 0 次,lob 物理讀取 0 次,lob 預讀 0 次。
(10 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 16 毫秒,占用時間 = 498 毫秒。
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒,占用時間 = 0 毫秒。
結(jié)論:通過較多數(shù)據(jù) 和 較少數(shù)據(jù)的測試,在較少數(shù)據(jù)的情況下 not in 比 except 性能好,但是在較多數(shù)據(jù)情況下 execpt 比 not in 出色。
看執(zhí)行計劃可以得知 如何 在 tb1 和tb2 上建立索引,那么except 的執(zhí)行計劃開可以得到優(yōu)化。
如果大家有興趣可以看看 not exists 的執(zhí)行計劃。建議:
大家不要迷信測試結(jié)果,因為所有的性能都是和執(zhí)行計劃密切相關(guān)的。而執(zhí)行計劃和統(tǒng)計數(shù)據(jù)又密不可分。
所以過度的迷信測試結(jié)果,可能會對生產(chǎn)庫造成性能的影響達不到預期的性能效果。
相關(guān)文章
SQLSERVER分頁查詢關(guān)于使用Top方式和row_number()解析函數(shù)的不同
這篇文章主要介紹了SQLSERVER分頁查詢關(guān)于使用Top方式和row_number()解析函數(shù)的不同的相關(guān)資料,需要的朋友可以參考下2016-02-02
詳解將DataGrip連接到MS SQL Server的方法
這篇文章主要介紹了詳解將DataGrip連接到MS SQL Server的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-11-11
Sql Server 2016新功能之Row-Level Security(值得關(guān)注)
Sql Server 2016 有一個新功能叫 Row-Level Security 。下面通過實例給大家介紹Sql Server 2016新功能之Row-Level Security,感興趣的朋友一起看看吧2016-11-11

