MySQL中distinct和group?by去重效率區(qū)別淺析
一、distinct
distinct的作用
在mysql中,distinct關(guān)鍵字的主要作用就是對(duì)數(shù)據(jù)庫(kù)表中一個(gè)或者多個(gè)字段重復(fù)的數(shù)據(jù)進(jìn)行過(guò)濾,只返回其中的一條數(shù)據(jù)給用戶,distinct只可以在select中使用
distinct的原理
distinct進(jìn)行去重的主要原理是通過(guò)先對(duì)要進(jìn)行去重的數(shù)據(jù)進(jìn)行分組操作,然后從分組后的每組數(shù)據(jù)中去一條返回給客戶端,在這個(gè)分組的過(guò)程可能會(huì)出現(xiàn)兩種不同的情況:
distinct 依賴的字段全部包含索引:
該情況mysql直接通過(guò)操作索引對(duì)滿足條件的數(shù)據(jù)進(jìn)行分組,然后從分組后的每組數(shù)據(jù)中去一條數(shù)據(jù)。
distinct 依賴的字段未全部包含索引:
該情況由于索引不能滿足整個(gè)去重分組的過(guò)程,所以需要用到臨時(shí)表,mysql首先需要將滿足條件的數(shù)據(jù)放到臨時(shí)表中,然后在臨時(shí)表中對(duì)該部分?jǐn)?shù)據(jù)進(jìn)行分組,然后從臨時(shí)表中每個(gè)分組的數(shù)據(jù)中去一條數(shù)據(jù),在臨時(shí)表中進(jìn)行分組的過(guò)程中不會(huì)對(duì)數(shù)據(jù)進(jìn)行排序。
distinct的語(yǔ)法:
select distinct expression[,expression…] from tables [where conditions];
在使用distinct的過(guò)程中主要注意一下幾點(diǎn):
在對(duì)字段進(jìn)行去重的時(shí)候,要保證distinct在所有字段的最前面
如果distinct關(guān)鍵字后面有多個(gè)字段時(shí),則會(huì)對(duì)多個(gè)字段進(jìn)行組合去重,只有多個(gè)字段組合起來(lái)的值是相等的才會(huì)被去重
二、group by
groupby在Mysql8.0之前會(huì)進(jìn)行隱式排序,導(dǎo)致觸發(fā)filesort,sql執(zhí)行效率低下,Mysql8.0開(kāi)始,Mysql就刪除了隱式排序
隱式排序
對(duì)于隱式排序,我們可以參考Mysql官方的解釋:
MySQL :: MySQL 5.7 Reference Manual :: 8.2.1.14 ORDER BY Optimization
GROUP BY implicitly sorts by default (that is, in the absence of ASC
or DESC designators for GROUP BY columns). However, relying on
implicit GROUP BY sorting (that is, sorting in the absence of ASC or
DESC designators) or explicit sorting for GROUP BY (that is, by using
explicit ASC or DESC designators for GROUP BY columns) is deprecated.
To produce a given sort order, provide an ORDER BY clause.
大致解釋一下:
GROUP BY 默認(rèn)隱式排序(指在 GROUP BY 列沒(méi)有 ASC 或 DESC 指示符的情況下也會(huì)進(jìn)行排序)。然而,GROUPBY進(jìn)行顯式或隱式排序已經(jīng)過(guò)時(shí)(deprecated)了,要生成給定的排序順序,請(qǐng)?zhí)峁?ORDER BY 子句。
所以,在Mysql8.0之前,Group by會(huì)默認(rèn)根據(jù)作用字段(Groupby的后接字段)對(duì)結(jié)果進(jìn)行排序。在能利用索引的情況下,Group by不需要額外進(jìn)行排序操作;但當(dāng)無(wú)法利用索引排序時(shí),Mysql優(yōu)化器就不得不選擇通過(guò)使用臨時(shí)表然后再排序的方式來(lái)實(shí)現(xiàn)GROUPBY了。且當(dāng)結(jié)果集的大小超出系統(tǒng)設(shè)置臨時(shí)表大小時(shí),Mysql會(huì)將臨時(shí)表數(shù)據(jù)copy到磁盤(pán)上面再進(jìn)行操作,語(yǔ)句的執(zhí)行效率會(huì)變得極低。這也是Mysql選擇將此操作(隱式排序)棄用的原因。
基于上述原因,Mysql在8.0時(shí),對(duì)此進(jìn)行了優(yōu)化更新:
MySQL :: MySQL 8.0 Reference Manual :: 8.2.1.16 ORDER BY Optimization
Previously (MySQL 5.7 and lower), GROUP BY sorted implicitly under
certain conditions. In MySQL 8.0, that no longer occurs, so specifying
ORDER BY NULL at the end to suppress implicit sorting (as was done
previously) is no longer necessary. However, query results may differ
from previous MySQL versions. To produce a given sort order, provide
an ORDER BY claus
大致解釋一下:
從前(Mysql5.7版本之前),Group by會(huì)根據(jù)確定的條件進(jìn)行隱式排序。在mysql 8.0中,已經(jīng)移除了這個(gè)功能,所以不再需要通過(guò)添加order by null 來(lái)禁止隱式排序了,但是,查詢結(jié)果可能與以前的 MySQL 版本不同。要生成給定順序的結(jié)果,請(qǐng)按通過(guò)ORDER BY指定需要進(jìn)行排序的字段。
三、distinct 和 group by 比較
在語(yǔ)義相同,有索引的情況下:
group by和distinct都能使用索引,效率相同。因?yàn)間roupby和distinct近乎等價(jià),distinct可以被看做是特殊的group by。
在語(yǔ)義相同,無(wú)索引的情況下:
distinct效率高于group by。原因是distinct 和 group by都會(huì)進(jìn)行分組操作,但group
by在Mysql8.0之前會(huì)進(jìn)行隱式排序,導(dǎo)致觸發(fā)filesort,sql執(zhí)行效率低下。
但從Mysql8.0開(kāi)始,Mysql就刪除了隱式排序,所以,此時(shí)在語(yǔ)義相同,無(wú)索引的情況下,groupby和distinct的執(zhí)行效率也是近乎等價(jià)的。
推薦group by的原因:
group by語(yǔ)義更為清晰 group by可對(duì)數(shù)據(jù)進(jìn)行更為復(fù)雜的一些處理 相比于distinct來(lái)說(shuō),group by的語(yǔ)義明確。且由于distinct關(guān)鍵字會(huì)對(duì)所有字段生效,在進(jìn)行復(fù)合業(yè)務(wù)處理時(shí),group by的使用靈活性更高,groupby能根據(jù)分組情況,對(duì)數(shù)據(jù)進(jìn)行更為復(fù)雜的處理,例如通過(guò)having對(duì)數(shù)據(jù)進(jìn)行過(guò)濾,或通過(guò)聚合函數(shù)對(duì)數(shù)據(jù)進(jìn)行運(yùn)算。
distinct 主要是對(duì)數(shù)據(jù)兩兩進(jìn)行比較,需要遍歷整個(gè)表
group by 是在查詢時(shí)先把數(shù)據(jù)按照分組字段分組出來(lái)再查詢,當(dāng)數(shù)據(jù)量較大時(shí),group by 速度要優(yōu)于 distinct
總結(jié)
到此這篇關(guān)于MySQL中distinct和group by去重效率區(qū)別的文章就介紹到這了,更多相關(guān)MySQL distinct和group by去重效率內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Win2003服務(wù)器安裝及設(shè)置教程 MySQL安全設(shè)置圖文教程
Win2003服務(wù)器安裝及設(shè)置教程,一般腳本之家為客戶都是將MySQL運(yùn)行于普通用戶下,這樣才會(huì)盡量避免提權(quán),新建用戶什么的2012-05-05
利用MySQL函數(shù)實(shí)現(xiàn)判斷視頻擴(kuò)展名的代碼
MySQL擁有強(qiáng)大的自定義函數(shù)功能,如下,我寫(xiě)了一個(gè)用MySQL函數(shù) 判斷視頻地址是否可以手機(jī)端播放2012-02-02
MySQL Delete 刪數(shù)據(jù)后磁盤(pán)空間未釋放的原因
這篇文章主要介紹了MySQL Delete 刪數(shù)據(jù)后磁盤(pán)空間未釋放的原因,幫助大家更好的理解和學(xué)習(xí)使用MySQL,感興趣的朋友可以了解下2021-05-05
Mybatis集成MySQL使用游標(biāo)查詢處理大批量數(shù)據(jù)方式
這篇文章主要介紹了Mybatis集成MySQL使用游標(biāo)查詢處理大批量數(shù)據(jù)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01
mysql建表報(bào)錯(cuò):invalid?default?value?for?'date'的解決方
最近遇到一個(gè)這樣的問(wèn)題,出現(xiàn)了invalid default value for 'end_date'錯(cuò)誤,所以下面這篇文章主要給大家介紹了關(guān)于mysql建表報(bào)錯(cuò):invalid?default?value?for?'date'的解決方法,需要的朋友可以參考下2022-12-12
MySQL數(shù)據(jù)庫(kù)主從復(fù)制原理及作用分析
這篇文章主要介紹了MySQL數(shù)據(jù)庫(kù)主從復(fù)制原理并分析了主從復(fù)制的作用和使用方法,有需要的的朋友可以借鑒參考下,希望可以有所幫助,感謝閱讀2021-09-09
mysql 5.7.18 Installer安裝下載圖文教程
這篇文章主要為大家詳細(xì)介紹了mysql 5.7.18 Installer安裝下載圖文教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-09-09

