概述MySQL統(tǒng)計(jì)信息
MySQL執(zhí)行SQL會(huì)經(jīng)過(guò)SQL解析和查詢優(yōu)化的過(guò)程,解析器將SQL分解成數(shù)據(jù)結(jié)構(gòu)并傳遞到后續(xù)步驟,查詢優(yōu)化器發(fā)現(xiàn)執(zhí)行SQL查詢的最佳方案、生成執(zhí)行計(jì)劃。查詢優(yōu)化器決定SQL如何執(zhí)行,依賴于數(shù)據(jù)庫(kù)的統(tǒng)計(jì)信息,下面我們介紹MySQL 5.7中innodb統(tǒng)計(jì)信息的相關(guān)內(nèi)容。
MySQL統(tǒng)計(jì)信息的存儲(chǔ)分為兩種,非持久化和持久化統(tǒng)計(jì)信息。
一、非持久化統(tǒng)計(jì)信息
非持久化統(tǒng)計(jì)信息存儲(chǔ)在內(nèi)存里,如果數(shù)據(jù)庫(kù)重啟,統(tǒng)計(jì)信息將丟失。有兩種方式可以設(shè)置為非持久化統(tǒng)計(jì)信息:
|
1 全局變量, INNODB_STATS_PERSISTENT=OFF |
|
2 CREATE/ALTER表的參數(shù), STATS_PERSISTENT=0 |
非持久化統(tǒng)計(jì)信息在以下情況會(huì)被自動(dòng)更新:
|
1 執(zhí)行ANALYZE TABLE |
|
2 innodb_stats_on_metadata=ON情況下,執(zhí)SHOW TABLE STATUS, SHOW INDEX, 查詢 INFORMATION_SCHEMA下的TABLES, STATISTICS |
|
3 啟用--auto-rehash功能情況下,使用mysql client登錄 |
|
4 表第一次被打開 |
|
5 距上一次更新統(tǒng)計(jì)信息,表1/16的數(shù)據(jù)被修改 |
非持久化統(tǒng)計(jì)信息的缺點(diǎn)顯而易見,數(shù)據(jù)庫(kù)重啟后如果大量表開始更新統(tǒng)計(jì)信息,會(huì)對(duì)實(shí)例造成很大影響,所以目前都會(huì)使用持久化統(tǒng)計(jì)信息。
二、持久化統(tǒng)計(jì)信息
5.6.6開始,MySQL默認(rèn)使用了持久化統(tǒng)計(jì)信息,即INNODB_STATS_PERSISTENT=ON,持久化統(tǒng)計(jì)信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。
持久化統(tǒng)計(jì)信息在以下情況會(huì)被自動(dòng)更新:
|
1 INNODB_STATS_AUTO_RECALC=ON 情況下,表中10%的數(shù)據(jù)被修改 |
| 2 增加新的索引 |
innodb_table_stats是表的統(tǒng)計(jì)信息,innodb_index_stats是索引的統(tǒng)計(jì)信息,各字段含義如下:
|
innodb_table_stats |
|
|
database_name |
數(shù)據(jù)庫(kù)名 |
|
table_name |
表名 |
|
last_update |
統(tǒng)計(jì)信息最后一次更新時(shí)間 |
|
n_rows |
表的行數(shù) |
|
clustered_index_size |
聚集索引的頁(yè)的數(shù)量 |
|
sum_of_other_index_sizes |
其他索引的頁(yè)的數(shù)量 |
|
innodb_index_stats |
|
|
database_name |
數(shù)據(jù)庫(kù)名 |
|
table_name |
表名 |
|
index_name |
索引名 |
|
last_update |
統(tǒng)計(jì)信息最后一次更新時(shí)間 |
|
stat_name |
統(tǒng)計(jì)信息名 |
|
stat_value |
統(tǒng)計(jì)信息的值 |
|
sample_size |
采樣大小 |
|
stat_description |
類型說(shuō)明 |
為更好的理解innodb_index_stats,建一張測(cè)試表做說(shuō)明:
CREATE TABLE t1 ( a INT, b INT, c INT, d INT, e INT, f INT, PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f) ) ENGINE=INNODB;
寫入數(shù)據(jù)如下:

查看t1表的統(tǒng)計(jì)信息,需主要關(guān)注stat_name和stat_value字段

tat_name=size時(shí):stat_value表示索引的頁(yè)的數(shù)量
stat_name=n_leaf_pages時(shí):stat_value表示葉子節(jié)點(diǎn)的數(shù)量
stat_name=n_diff_pfxNN時(shí):stat_value表示索引字段上唯一值的數(shù)量,此處做一下具體說(shuō)明:
1、n_diff_pfx01表示索引第一列distinct之后的數(shù)量,如PRIMARY的a列,只有一個(gè)值1,所以index_name='PRIMARY' and stat_name='n_diff_pfx01'時(shí),stat_value=1。
2、n_diff_pfx02表示索引前兩列distinct之后的數(shù)量,如i2uniq的e,f列,有4個(gè)值,所以index_name='i2uniq' and stat_name='n_diff_pfx02'時(shí),stat_value=4。
3、對(duì)于非唯一索引,會(huì)在原有列之后加上主鍵索引,如index_name='i1' and stat_name='n_diff_pfx03',在原索引列c,d后加了主鍵列a,(c,d,a)的distinct結(jié)果為2。
了解了stat_name和stat_value的具體含義,就可以協(xié)助我們排查SQL執(zhí)行時(shí)為什么沒有使用合適的索引,例如某個(gè)索引n_diff_pfxNN的stat_value遠(yuǎn)小于實(shí)際值,查詢優(yōu)化器認(rèn)為該索引選擇度較差,就有可能導(dǎo)致使用錯(cuò)誤的索引。
三、統(tǒng)計(jì)信息不準(zhǔn)確的處理
我們查看執(zhí)行計(jì)劃,發(fā)現(xiàn)未使用正確的索引,如果是innodb_index_stats中統(tǒng)計(jì)信息差別較大引起,可通過(guò)以下方式處理:
1、手動(dòng)更新統(tǒng)計(jì)信息,注意執(zhí)行過(guò)程中會(huì)加讀鎖:
ANALYZETABLE TABLE_NAME;
2、如果更新后統(tǒng)計(jì)信息仍不準(zhǔn)確,可考慮增加表采樣的數(shù)據(jù)頁(yè),兩種方式可以修改:
a) 全局變量INNODB_STATS_PERSISTENT_SAMPLE_PAGES,默認(rèn)為20;
b) 單個(gè)表可以指定該表的采樣:
ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;
經(jīng)測(cè)試,此處STATS_SAMPLE_PAGES的最大值是65535,超出會(huì)報(bào)錯(cuò)。
目前MySQL并沒有提供直方圖的功能,某些情況下(如數(shù)據(jù)分布不均)僅僅更新統(tǒng)計(jì)信息不一定能得到準(zhǔn)確的執(zhí)行計(jì)劃,只能通過(guò)index hint的方式指定索引。新版本8.0會(huì)增加直方圖功能,讓我們期待MySQL越來(lái)越強(qiáng)大的功能吧!
相關(guān)文章
EXCEL數(shù)據(jù)上傳到SQL SERVER中的簡(jiǎn)單實(shí)現(xiàn)方法
以下是對(duì)EXCEL數(shù)據(jù)上傳到SQL SERVER中的簡(jiǎn)單實(shí)現(xiàn)方法進(jìn)行了詳細(xì)的分析介紹,需要的朋友可以過(guò)來(lái)參考下2013-08-08
win10下mysql 8.0.16 winx64安裝圖文最新教程
這篇文章主要為大家詳細(xì)介紹了win10下mysql 8.0.16 winx64安裝圖文最新教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-05-05
Mysql刪除數(shù)據(jù)以及數(shù)據(jù)表的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于Mysql刪除數(shù)據(jù)以及數(shù)據(jù)表的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11
MYSQL 數(shù)據(jù)庫(kù)導(dǎo)入導(dǎo)出命令
在不同操作系統(tǒng)或MySQL版本情況下,直接拷貝文件的方法可能會(huì)有不兼容的情況發(fā)生。所以一般推薦用SQL腳本形式導(dǎo)入。下面分別介紹兩種方法。2010-11-11

