SQLServer Execpt和not in 性能區(qū)別

更新時間：2012年01月20日 22:42:57 作者：

網(wǎng)上有很多 except 和 not in的返回結(jié)果區(qū)別這里就就提了

主要講 except 和 not in 的性能上的區(qū)別。

 
CREATE TABLE tb1(ID int) 
CREATE TABLE tb2(ID int) 
BEGIN TRAN 
DECLARE @i INT = 500 
WHILE @i > 0 
begin 
INSERT INTO dbo.tb1 
VALUES ( @i -- v - int 
) 
SET @i = @i -1 
end 
COMMIT我測試的時候tb1 是1000，tb2 是500 

復制代碼代碼如下:

 
DBCC FREESYSTEMCACHE ('ALL','default'); 
SET STATISTICS IO ON 
SET STATISTICS TIME on 
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; 
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 
SET STATISTICS IO OFF 
SET STATISTICS TIME OFF 

執(zhí)行計劃：

復制代碼代碼如下:

 
SELECT * FROM tb1 EXCEPT SELECT * FROM tb2; 
|--Merge Join(Right Anti Semi Join, MERGE:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID] = [master1].[dbo].[tb2].[ID])) 
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb2].[ID] ASC)) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--Sort(DISTINCT ORDER BY:([master1].[dbo].[tb1].[ID] ASC)) 
|--Table Scan(OBJECT:([master1].[dbo].[tb1])) 

復制代碼代碼如下:

 
SELECT * FROM tb1 WHERE id NOT IN(SELECT id FROM tb2);--得不到任何值 
|--Hash Match(Right Anti Semi Join, HASH:([master1].[dbo].[tb2].[ID])=([master1].[dbo].[tb1].[ID]), RESIDUAL:([master1].[dbo].[tb1].[ID]=[master1].[dbo].[tb2].[ID])) 
|--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--Nested Loops(Left Anti Semi Join) 
|--Nested Loops(Left Anti Semi Join, WHERE:([master1].[dbo].[tb1].[ID] IS NULL)) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb1])) 
| |--Top(TOP EXPRESSION:((1))) 
| |--Table Scan(OBJECT:([master1].[dbo].[tb2])) 
|--Row Count Spool 
|--Table Scan(OBJECT:([master1].[dbo].[tb2]), WHERE:([master1].[dbo].[tb2].[ID] IS NULL)) 

SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒，占用時間 = 0 毫秒。
(500 行受影響)
表 'tb1'。掃描計數(shù) 1，邏輯讀取 2 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 1，邏輯讀取 1 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
(6 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒，占用時間 = 528 毫秒。
(500 行受影響)
表 'Worktable'。掃描計數(shù) 0，邏輯讀取 0 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'tb2'。掃描計數(shù) 3，邏輯讀取 1002 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
表 'tb1'。掃描計數(shù) 1，邏輯讀取 2 次，物理讀取 0 次，預讀 0 次，lob 邏輯讀取 0 次，lob 物理讀取 0 次，lob 預讀 0 次。
(10 行受影響)
(1 行受影響)
SQL Server 執(zhí)行時間:
CPU 時間 = 16 毫秒，占用時間 = 498 毫秒。
SQL Server 執(zhí)行時間:
CPU 時間 = 0 毫秒，占用時間 = 0 毫秒。

結(jié)論：通過較多數(shù)據(jù) 和較少數(shù)據(jù)的測試，在較少數(shù)據(jù)的情況下 not in 比 except 性能好，但是在較多數(shù)據(jù)情況下 execpt 比 not in 出色。
看執(zhí)行計劃可以得知如何在 tb1 和tb2 上建立索引,那么except 的執(zhí)行計劃開可以得到優(yōu)化。

如果大家有興趣可以看看 not exists 的執(zhí)行計劃。建議：
大家不要迷信測試結(jié)果，因為所有的性能都是和執(zhí)行計劃密切相關(guān)的。而執(zhí)行計劃和統(tǒng)計數(shù)據(jù)又密不可分。
所以過度的迷信測試結(jié)果，可能會對生產(chǎn)庫造成性能的影響達不到預期的性能效果。