詳解MySQL中的字符集和排序規(guī)則
關(guān)鍵字: 字符集,utf8mb4,emoj
眾所周知,mysql的utf8是假的utf8,沒(méi)法存emoj等字符。要設(shè)置為utf8mb4...
問(wèn)題
同事給了一段Update語(yǔ)句,更新某張表id=xxx的某個(gè)字段;
CREATE TABLE `table_name` ( `id` int(11) NOT NULL AUTO_INCREMENT, `xxx_id` int(11) NOT NULL, `description` longtext COLLATE utf8mb4_unicode_ci NOT NULL, `start_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, `end_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, `max_xxx` int(11) NOT NULL DEFAULT '0', `max_xxx` int(11) NOT NULL DEFAULT '0', `xxx_generate_method` tinyint(4) NOT NULL, `xxx_generate_method` tinyint(4) NOT NULL, `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP, `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP, PRIMARY KEY (`id`), KEY `idx_table_name_xxx_id` (`xxx_id`), KEY `idx_table_name_end_time` (`end_time`), KEY `idx_table_name_start_time` (`start_time`) ) ENGINE=InnoDB AUTO_INCREMENT=5822 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
登陸跳板機(jī),連接遠(yuǎn)程數(shù)據(jù)庫(kù)后,執(zhí)行sql,報(bào)錯(cuò): ERROR 1366 (HY000): Incorrect string value: '\xF0\x9F\x93\xA3Ev...'
\xF0\x9F\x93\xA3恰好是轉(zhuǎn)義之后的emoj
這張表所在的庫(kù)的字符集是utf8,但是表指定了是utf8mb4,字段沒(méi)有指定,僅指定了排序方式為 utf8mb4_unicode_ci
據(jù)說(shuō),字符集規(guī)則會(huì)按照 字段設(shè)置>表設(shè)置>庫(kù)設(shè)置的順序。
此處 這個(gè)字段沒(méi)有設(shè)置字符集,那應(yīng)該用表的字符集即*DEFAULT CHARSET=utf8mb4 *
(且經(jīng)過(guò)試驗(yàn),如果COLLATE=utf8mb4_unicode_ci,那字符集不可能是utf8,只可能是utf8mb4,不然報(bào)錯(cuò)時(shí)會(huì)直接報(bào)錯(cuò))
下面補(bǔ)充一些mysql字符集的知識(shí)
查看庫(kù)級(jí)別的 字符集和編碼設(shè)置
SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%';


Variable_name character_set_client character_set_connection character_set_database character_set_filesystem character_set_results character_set_server character_set_system character_sets_dir
這都是干啥的?
這些變量是 MySQL 中與字符集相關(guān)的變量,用于控制不同環(huán)境中的字符集設(shè)置。以下是對(duì)每個(gè)變量的簡(jiǎn)要說(shuō)明:
character_set_client: 客戶端連接到 MySQL 服務(wù)器時(shí)所使用的字符集。character_set_connection: 當(dāng)前連接的默認(rèn)字符集。它可以在客戶端連接時(shí)通過(guò)SET NAMES命令來(lái)設(shè)置。character_set_database: 默認(rèn)數(shù)據(jù)庫(kù)的字符集。在創(chuàng)建數(shù)據(jù)庫(kù)時(shí)設(shè)置,新創(chuàng)建的表將繼承該字符集。character_set_filesystem: 文件系統(tǒng)的默認(rèn)字符集。用于存儲(chǔ)文件名和路徑的字符集。character_set_results: 返回給客戶端的結(jié)果集的字符集。character_set_server: MySQL 服務(wù)器的默認(rèn)字符集。用于新建數(shù)據(jù)庫(kù)、表和列的默認(rèn)字符集。character_set_system: MySQL 系統(tǒng)數(shù)據(jù)字典和內(nèi)部字符串的字符集。character_sets_dir: MySQL 字符集定義文件的目錄路徑。
這些變量的設(shè)置是相互關(guān)聯(lián)的,通過(guò)調(diào)整它們的值可以控制 MySQL 在不同環(huán)境中的字符集行為。確保這些變量的值一致并與你的應(yīng)用程序和數(shù)據(jù)的字符集一致,可以確保正確地存儲(chǔ)、傳輸和顯示數(shù)據(jù)。
注意:在修改這些字符集相關(guān)的變量之前,請(qǐng)確保了解其含義和影響,并在備份數(shù)據(jù)的情況下謹(jǐn)慎操作。修改字符集設(shè)置可能會(huì)對(duì)現(xiàn)有數(shù)據(jù)和應(yīng)用程序產(chǎn)生影響。
一般說(shuō)的字符集和排序規(guī)則,應(yīng)該主要看
SHOW VARIABLES LIKE 'character_set_database'; SHOW VARIABLES LIKE 'collation_database';
查看表級(jí)別的字符集和編碼設(shè)置
SHOW CREATE TABLE `your_table_name`;
能得到建表語(yǔ)句,看最后的 DEFAULT CHARSET
具體到table的column的字符集如何查看?
SHOW FULL COLUMNS FROM your_table_name;
在查詢結(jié)果中,查找 "Collation" 列。該列顯示每個(gè)列(字段)的字符集和排序規(guī)則。
請(qǐng)注意,"Collation" 列中的值表示字符集和排序規(guī)則的組合。常見(jiàn)的字符集包括 UTF-8(如 utf8mb4)和 Latin1(如 latin1)。



Collation 本意是???,校對(duì)之意,在數(shù)據(jù)庫(kù)中 是排序規(guī)則
這個(gè)字段的第一部分,其實(shí)已經(jīng)指明了字符集...所以SHOW FULL COLUMNS沒(méi)有必要再多一個(gè)字符集列
那么,問(wèn)題何在呢?
起初搜到,需要在連接時(shí)指定為utf8mb4才可以
即 mysql --default-character-set=utf8mb4 -u root -h xxx.xxx.xx.xx -p密碼
但還是不行...
最后發(fā)現(xiàn)執(zhí)行 SET NAMES utf8mb4 后再執(zhí)行更新語(yǔ)句,成功!
根據(jù)報(bào)錯(cuò)信息,看起來(lái)在嘗試更新 xxxxx 表中的 xxxxxxx 字段時(shí)遇到了錯(cuò)誤。報(bào)錯(cuò)信息是 ERROR 1366 (HY000): Incorrect string value: '\xF0\x9F\x93\xA3Ev...' for column 'xxxxxxx' at row 1 ,這表明在該字段中插入了無(wú)效的字符。
盡管您已經(jīng)將該字段的字符集設(shè)置為 utf8mb4 ,支持存儲(chǔ)四字節(jié)的UTF-8字符,但有可能連接或會(huì)話的字符集設(shè)置仍然不兼容。為了確保字符集一致,您可以嘗試執(zhí)行以下操作:
- 在更新語(yǔ)句之前,執(zhí)行以下SQL語(yǔ)句設(shè)置會(huì)話字符集為
utf8mb4:
SET NAMES utf8mb4;
- 然后,再執(zhí)行更新語(yǔ)句:
UPDATE `xxxxx` SET `xxxxxxx` = '...' WHERE (`id` = 5136);
通過(guò)這樣的設(shè)置,會(huì)話的字符集將與字段的字符集一致,可以正常存儲(chǔ)包含四字節(jié)UTF-8字符的字符串。
如果問(wèn)題仍然存在,請(qǐng)確保數(shù)據(jù)庫(kù)連接和客戶端工具的字符集設(shè)置與字段的字符集設(shè)置一致。另外,您還可以檢查MySQL服務(wù)器的全局字符集設(shè)置,以確保它也是 utf8mb4 。
SET NAMES utf8mb4什么?
"SET NAMES utf8mb4" 是一個(gè)MySQL命令,用于設(shè)置數(shù)據(jù)庫(kù)連接的字符集編碼為utf8mb4。在MySQL中,字符集決定了數(shù)據(jù)庫(kù)如何存儲(chǔ)和處理數(shù)據(jù)。
utf8mb4是一種字符集編碼,支持Unicode字符集的全部字符,包括一些較早版本的utf8字符集無(wú)法表示的一些字符。utf8mb4編碼可以處理各種語(yǔ)言的文字和符號(hào),包括一些較為特殊的字符,如表情符號(hào)和特殊符號(hào)等。
通過(guò)將數(shù)據(jù)庫(kù)連接的字符集編碼設(shè)置為utf8mb4,可以確保數(shù)據(jù)庫(kù)可以正確地存儲(chǔ)、檢索和顯示各種字符,避免出現(xiàn)亂碼或字符丟失的問(wèn)題。這在處理多語(yǔ)言或包含特殊字符的應(yīng)用程序中特別重要。
只對(duì)當(dāng)前連接有效嗎?
是的,"SET NAMES utf8mb4" 命令只對(duì)當(dāng)前數(shù)據(jù)庫(kù)連接有效。這意味著只有在執(zhí)行該命令后建立的數(shù)據(jù)庫(kù)連接會(huì)使用 utf8mb4 字符集編碼。
如果你在程序中使用了多個(gè)數(shù)據(jù)庫(kù)連接,每個(gè)連接都需要單獨(dú)執(zhí)行 "SET NAMES utf8mb4" 命令來(lái)設(shè)置字符集編碼。
另外,如果你希望永久地將數(shù)據(jù)庫(kù)的字符集編碼設(shè)置為 utf8mb4,你需要修改數(shù)據(jù)庫(kù)的默認(rèn)字符集配置。這樣,在新建的數(shù)據(jù)庫(kù)連接中不需要再手動(dòng)執(zhí)行 "SET NAMES utf8mb4" 命令,因?yàn)檫B接會(huì)默認(rèn)使用數(shù)據(jù)庫(kù)的字符集配置。請(qǐng)注意,在修改數(shù)據(jù)庫(kù)的默認(rèn)字符集之前,請(qǐng)確保備份數(shù)據(jù)和相應(yīng)的預(yù)防措施。
結(jié)論
可能是:數(shù)據(jù)庫(kù)是utf8,即便我在連接時(shí)指定 --default-character-set=utf8mb4 ,依然會(huì)用utf8,必須要通過(guò) SET NAMES utf8mb4 再設(shè)置一次
為了驗(yàn)證,通過(guò) mysql --default-character-set=utf8mb4 -u root -h xxx.xxx.xx.xx -p密碼 連接mysql,select 剛才更新成功的那條記錄,發(fā)現(xiàn)emoj無(wú)法正常顯示; 執(zhí)行 SET NAMES utf8mb4 后,再select能正??吹絜moj
設(shè)置mysql數(shù)據(jù)庫(kù)的字符集和編碼設(shè)置(謹(jǐn)慎操作,一般不要亂改)
要設(shè)置 MySQL 數(shù)據(jù)庫(kù)的字符集和編碼設(shè)置,你可以采取以下步驟:
登錄到 MySQL 數(shù)據(jù)庫(kù)服務(wù)器,可以使用以下命令: mysql -u your_username -p 替換
your_username為你的數(shù)據(jù)庫(kù)用戶名。
在登錄后,可以執(zhí)行以下命令來(lái)查看當(dāng)前的字符集和編碼設(shè)置:
SHOW VARIABLES LIKE 'character_set%'; SHOW VARIABLES LIKE 'collation%';
這將顯示當(dāng)前的字符集和編碼設(shè)置。
若要修改數(shù)據(jù)庫(kù)的字符集和編碼設(shè)置,可以執(zhí)行以下命令(以u(píng)tf8mb4為例):
ALTER DATABASE your_database_name CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;替換
your_database_name為你要修改的數(shù)據(jù)庫(kù)名稱。
如果需要修改特定表的字符集和編碼設(shè)置,可以執(zhí)行以下命令(以u(píng)tf8mb4為例):
ALTER TABLE your_table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;
替換 your_table_name 為你要修改的表名稱。
如果你希望新創(chuàng)建的表默認(rèn)采用特定的字符集和編碼,可以在創(chuàng)建表時(shí)指定:
CREATE TABLE your_table_name ( ... ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
替換 your_table_name 為你要?jiǎng)?chuàng)建的表名稱,并根據(jù)需要修改其他表的列和選項(xiàng)。
重啟 MySQL 服務(wù)以使更改生效,具體的重啟方式取決于你的操作系統(tǒng)和安裝方式。
請(qǐng)注意,修改字符集和編碼設(shè)置可能會(huì)影響現(xiàn)有數(shù)據(jù)和應(yīng)用程序,因此在進(jìn)行任何更改之前,請(qǐng)確保備份數(shù)據(jù)庫(kù)并謹(jǐn)慎操作。
如何 修改數(shù)據(jù)庫(kù)的默認(rèn)字符集配置
要修改數(shù)據(jù)庫(kù)的默認(rèn)字符集配置,你需要執(zhí)行以下步驟:
- 登錄到你的MySQL數(shù)據(jù)庫(kù)服務(wù)器。
- 執(zhí)行以下命令來(lái)打開(kāi)MySQL的配置文件(通常是my.cnf或my.ini): sudo nano /etc/mysql/my.cnf 如果你使用的是Windows系統(tǒng),則路徑可能是
C:\ProgramData\MySQL\MySQL Server X.X\my.ini,其中X.X代表你的MySQL版本號(hào)。 - 在配置文件中找到
[mysqld]部分。 - 添加或修改以下兩行來(lái)設(shè)置默認(rèn)字符集編碼為 utf8mb4: [mysqld] character-set-server=utf8mb4 collation-server=utf8mb4_unicode_ci 上述配置將字符集設(shè)置為 utf8mb4,同時(shí)使用了
utf8mb4_unicode_ci校對(duì)規(guī)則。你也可以選擇其他適合你的校對(duì)規(guī)則。 - 保存并關(guān)閉配置文件。
- 重新啟動(dòng)MySQL服務(wù)以使配置生效,可以使用適合你的操作系統(tǒng)的命令,例如:
- 在Linux上使用: sudo systemctl restart mysql
- 在Windows上使用: net stop MySQL net start MySQL
- 現(xiàn)在,新建的數(shù)據(jù)庫(kù)連接將默認(rèn)使用 utf8mb4 字符集編碼。
請(qǐng)注意,修改數(shù)據(jù)庫(kù)的默認(rèn)字符集可能會(huì)對(duì)現(xiàn)有的數(shù)據(jù)庫(kù)和數(shù)據(jù)產(chǎn)生影響。在執(zhí)行這些步驟之前,請(qǐng)確保備份數(shù)據(jù)并采取相應(yīng)的預(yù)防措施。
以上就是詳解MySQL中的字符集和排序規(guī)則的詳細(xì)內(nèi)容,更多關(guān)于MySQL字符集和排序規(guī)則的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
mysql添加enum類(lèi)型的字段實(shí)現(xiàn)
Enum類(lèi)型它允許我們?cè)谝粋€(gè)有限的選項(xiàng)列表中選擇一個(gè)值,本文主要介紹了mysql添加enum類(lèi)型的字段實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2024-01-01
mysql整數(shù)數(shù)據(jù)類(lèi)型深入解析
本篇文章是對(duì)mysql中的整數(shù)數(shù)據(jù)類(lèi)型進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-06-06
MySQL Antelope和Barracuda的區(qū)別分析
這篇文章主要介紹了MySQL Antelope和Barracuda的區(qū)別分析,Antelope和Barracude都是一種文件格式,需要的朋友可以參考下2014-07-07
SQL查詢超時(shí)的設(shè)置方法(關(guān)于timeout的處理)
為了優(yōu)化OceanBase的query timeout設(shè)置方式,特調(diào)研MySQL關(guān)于timeout的處理,下面與大家分享下處理記錄,感興趣的朋友可以參考下哈2013-04-04
mySQL中LEN()與DATALENGTH()的區(qū)別
LEN返回指定字符串表達(dá)式的字符數(shù),其中不包含尾隨空格。DATALENGTH返回用于表示任何表達(dá)式的字節(jié)數(shù)。2011-03-03
Mysql聯(lián)表查詢索引失效的幾種問(wèn)題解決
本文主要介紹了Mysql聯(lián)表查詢索引失效的幾種問(wèn)題解決,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2025-10-10
MySQL5.6 Replication主從復(fù)制(讀寫(xiě)分離) 配置完整版
這篇文章主要介紹了MySQL5.6 Replication主從復(fù)制(讀寫(xiě)分離) 配置完整版,需要的朋友可以參考下2016-04-04

