深入理解mysql SET NAMES和mysql(i)_set_charset的區(qū)別
更新時(shí)間:2012年01月30日 17:57:15 作者:
最近公司組織了個(gè)PHP安全編程的培訓(xùn), 其中涉及到一部分關(guān)于Mysql的 SET NAMES 和mysql_set_charset (mysqli_set_charset)的內(nèi)容
說到, 盡量使用mysqli_set_charset(mysqli:set_charset)而不是”SET NAMES”, 當(dāng)然, 這個(gè)內(nèi)容在PHP手冊中也有敘及, 但是卻沒有解釋為什么.
最近有好幾個(gè)朋友問我這個(gè)問題, 到底為什么?
問的人多了, 我也就覺得可以寫篇blog, 專門介紹下這部分的內(nèi)容了.
首先, 很多人都不知道”SET NAMES”到底是做了什么,
我之前的文章深入MySQL字符集設(shè)置中, 曾經(jīng)介紹過character_set_client/character_set_connection/character_set_results這三個(gè)MySQL的”環(huán)境變量”, 這里再簡單介紹下,
這三個(gè)變量, 分別告訴MySQL服務(wù)器, 客戶端的編碼集, 在傳輸給MySQL服務(wù)器的時(shí)候的編碼集, 以及期望MySQL返回的結(jié)果的編碼集.
比如, 通過使用”SET NAMES utf8″, 就告訴服務(wù)器, 我用的是utf-8編碼, 我希望你也給我返回utf-8編碼的查詢結(jié)果.
一般情況下, 使用”SET NAMES”就足夠了, 也是可以保證正確的. 那么為什么手冊又要說推薦使用mysqli_set_charset(PHP>=5.0.5)呢?
首先, 我們看看mysqli_set_charset到底做了什么(注意星號(hào)注釋處, mysql_set_charset類似):
//php-5.2.11-SRC/ext/mysqli/mysqli_nonapi.c line 342
PHP_FUNCTION(mysqli_set_charset)
{
MY_MYSQL *mysql;
zval *mysql_link;
char *cs_name = NULL;
unsigned int len;
if (zend_parse_method_parameters(ZEND_NUM_ARGS() TSRMLS_CC, getThis()
, "Os", &mysql_link, mysqli_link_class_entry, &cs_name, &len) == FAILURE) {
return;
}
MYSQLI_FETCH_RESOURCE(mysql, MY_MYSQL*, &mysql_link, "mysqli_link"
, MYSQLI_STATUS_VALID);
if (mysql_set_character_set(mysql->mysql, cs_name)) {
//** 調(diào)用libmysql的對應(yīng)函數(shù)
RETURN_FALSE;
}
RETURN_TRUE;
}
那mysql_set_character_set又做了什么呢?
//mysql-5.1.30-SRC/libmysql/client.c, line 3166:
int STDCALL mysql_set_character_set(MYSQL *mysql, const char *cs_name)
{
struct charset_info_st *cs;
const char *save_csdir= charsets_dir;
if (mysql->options.charset_dir)
charsets_dir= mysql->options.charset_dir;
if (strlen(cs_name) < MY_CS_NAME_SIZE &&
(cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
{
char buff[MY_CS_NAME_SIZE + 10];
charsets_dir= save_csdir;
/* Skip execution of "SET NAMES" for pre-4.1 servers */
if (mysql_get_server_version(mysql) < 40100)
return 0;
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
}
//以下省略
我們可以看到, mysqli_set_charset除了做了”SET NAMES”以外, 還多做了一步:
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
而對于mysql這個(gè)核心結(jié)構(gòu)的成員charset又有什么作用呢?
這就要說說mysql_real_escape_string()了, 這個(gè)函數(shù)和mysql_escape_string的區(qū)別就是, 它會(huì)考慮”當(dāng)前”字符集. 那么這個(gè)當(dāng)前字符集從哪里來呢?
對了, 你猜的沒錯(cuò), 就是mysql->charset.
mysql_real_string在判斷寬字符集的字符的時(shí)候, 就根據(jù)這個(gè)成員變量來分別采用不同的策略, 比如如果是utf-8, 那么就會(huì)采用libmysql/ctype-utf8.c.
看個(gè)實(shí)例, 默認(rèn)mysql連接字符集是latin-1, (經(jīng)典的5c問題):
<?php
$db = mysql_connect('localhost:3737', 'root' ,'123456');
mysql_select_db("test");
$a = "\x91\x5c";//"慭"的gbk編碼, 低字節(jié)為5c, 也就是ascii中的"\"
var_dump(addslashes($a));
var_dump(mysql_real_escape_string($a, $db));
mysql_query("set names gbk");
var_dump(mysql_real_escape_string($a, $db));
mysql_set_charset("gbk");
var_dump(mysql_real_escape_string($a, $db));
?>
因?yàn)? “慭”的gbk編碼低字節(jié)為5c, 也就是ascii中的”\”, 而因?yàn)槌薽ysql(i)_set_charset影響mysql->charset以外, 其他時(shí)刻mysql->charset都為默認(rèn)值, 所以, 結(jié)果就是:
$ php -f 5c.php
string(3) "慭\"
string(3) "慭\"
string(3) "慭\"
string(2) "慭"
大家現(xiàn)在很清楚了吧?
最近有好幾個(gè)朋友問我這個(gè)問題, 到底為什么?
問的人多了, 我也就覺得可以寫篇blog, 專門介紹下這部分的內(nèi)容了.
首先, 很多人都不知道”SET NAMES”到底是做了什么,
我之前的文章深入MySQL字符集設(shè)置中, 曾經(jīng)介紹過character_set_client/character_set_connection/character_set_results這三個(gè)MySQL的”環(huán)境變量”, 這里再簡單介紹下,
這三個(gè)變量, 分別告訴MySQL服務(wù)器, 客戶端的編碼集, 在傳輸給MySQL服務(wù)器的時(shí)候的編碼集, 以及期望MySQL返回的結(jié)果的編碼集.
比如, 通過使用”SET NAMES utf8″, 就告訴服務(wù)器, 我用的是utf-8編碼, 我希望你也給我返回utf-8編碼的查詢結(jié)果.
一般情況下, 使用”SET NAMES”就足夠了, 也是可以保證正確的. 那么為什么手冊又要說推薦使用mysqli_set_charset(PHP>=5.0.5)呢?
首先, 我們看看mysqli_set_charset到底做了什么(注意星號(hào)注釋處, mysql_set_charset類似):
復(fù)制代碼 代碼如下:
//php-5.2.11-SRC/ext/mysqli/mysqli_nonapi.c line 342
PHP_FUNCTION(mysqli_set_charset)
{
MY_MYSQL *mysql;
zval *mysql_link;
char *cs_name = NULL;
unsigned int len;
if (zend_parse_method_parameters(ZEND_NUM_ARGS() TSRMLS_CC, getThis()
, "Os", &mysql_link, mysqli_link_class_entry, &cs_name, &len) == FAILURE) {
return;
}
MYSQLI_FETCH_RESOURCE(mysql, MY_MYSQL*, &mysql_link, "mysqli_link"
, MYSQLI_STATUS_VALID);
if (mysql_set_character_set(mysql->mysql, cs_name)) {
//** 調(diào)用libmysql的對應(yīng)函數(shù)
RETURN_FALSE;
}
RETURN_TRUE;
}
那mysql_set_character_set又做了什么呢?
復(fù)制代碼 代碼如下:
//mysql-5.1.30-SRC/libmysql/client.c, line 3166:
int STDCALL mysql_set_character_set(MYSQL *mysql, const char *cs_name)
{
struct charset_info_st *cs;
const char *save_csdir= charsets_dir;
if (mysql->options.charset_dir)
charsets_dir= mysql->options.charset_dir;
if (strlen(cs_name) < MY_CS_NAME_SIZE &&
(cs= get_charset_by_csname(cs_name, MY_CS_PRIMARY, MYF(0))))
{
char buff[MY_CS_NAME_SIZE + 10];
charsets_dir= save_csdir;
/* Skip execution of "SET NAMES" for pre-4.1 servers */
if (mysql_get_server_version(mysql) < 40100)
return 0;
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
}
//以下省略
我們可以看到, mysqli_set_charset除了做了”SET NAMES”以外, 還多做了一步:
復(fù)制代碼 代碼如下:
sprintf(buff, "SET NAMES %s", cs_name);
if (!mysql_real_query(mysql, buff, strlen(buff)))
{
mysql->charset= cs;
}
而對于mysql這個(gè)核心結(jié)構(gòu)的成員charset又有什么作用呢?
這就要說說mysql_real_escape_string()了, 這個(gè)函數(shù)和mysql_escape_string的區(qū)別就是, 它會(huì)考慮”當(dāng)前”字符集. 那么這個(gè)當(dāng)前字符集從哪里來呢?
對了, 你猜的沒錯(cuò), 就是mysql->charset.
mysql_real_string在判斷寬字符集的字符的時(shí)候, 就根據(jù)這個(gè)成員變量來分別采用不同的策略, 比如如果是utf-8, 那么就會(huì)采用libmysql/ctype-utf8.c.
看個(gè)實(shí)例, 默認(rèn)mysql連接字符集是latin-1, (經(jīng)典的5c問題):
復(fù)制代碼 代碼如下:
<?php
$db = mysql_connect('localhost:3737', 'root' ,'123456');
mysql_select_db("test");
$a = "\x91\x5c";//"慭"的gbk編碼, 低字節(jié)為5c, 也就是ascii中的"\"
var_dump(addslashes($a));
var_dump(mysql_real_escape_string($a, $db));
mysql_query("set names gbk");
var_dump(mysql_real_escape_string($a, $db));
mysql_set_charset("gbk");
var_dump(mysql_real_escape_string($a, $db));
?>
因?yàn)? “慭”的gbk編碼低字節(jié)為5c, 也就是ascii中的”\”, 而因?yàn)槌薽ysql(i)_set_charset影響mysql->charset以外, 其他時(shí)刻mysql->charset都為默認(rèn)值, 所以, 結(jié)果就是:
復(fù)制代碼 代碼如下:
$ php -f 5c.php
string(3) "慭\"
string(3) "慭\"
string(3) "慭\"
string(2) "慭"
大家現(xiàn)在很清楚了吧?
相關(guān)文章
MySQL存儲(chǔ)引擎 InnoDB與MyISAM的區(qū)別
InnoDB和MyISAM是許多人在使用MySQL時(shí)最常用的兩個(gè)表類型,這兩個(gè)表類型各有優(yōu)劣,視具體應(yīng)用而定。2014-03-03
MyEclipse連接MySQL數(shù)據(jù)庫報(bào)錯(cuò)解決辦法
我們現(xiàn)在一般網(wǎng)站都是利用的MySQL數(shù)據(jù)庫搭建網(wǎng)站的,但是在網(wǎng)上看到很多網(wǎng)友吐槽數(shù)據(jù)庫連接不上的問題,現(xiàn)在我就結(jié)合相關(guān)資料向提出一些我個(gè)人的見解,希望對大家解決問題有幫助2014-01-01
MYSQL查詢時(shí)間范圍內(nèi)的數(shù)據(jù)示例代碼
這篇文章主要介紹了MYSQL查詢時(shí)間范圍內(nèi)的數(shù)據(jù),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-06-06
SQL行列轉(zhuǎn)置以及非常規(guī)的行列轉(zhuǎn)置示例代碼
轉(zhuǎn)置即旋轉(zhuǎn)數(shù)據(jù)表的橫縱方向,常用來改變數(shù)據(jù)布局,以便用新的角度觀察,下面這篇文章主要給大家介紹了關(guān)于SQL行列轉(zhuǎn)置以及非常規(guī)行列轉(zhuǎn)置的相關(guān)資料,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下2024-08-08
解決mysql登錄錯(cuò)誤:''Access denied for user ''root''@''localhost''
這篇文章主要介紹了mysql登錄錯(cuò)誤:'Access denied for user 'root'@'localhost',本文給出了操作過程及注意事項(xiàng),需要的朋友可以參考下2019-11-11
MySql中把一個(gè)表的數(shù)據(jù)插入到另一個(gè)表中的實(shí)現(xiàn)代碼
本篇文章是對MySql中把一個(gè)表的數(shù)據(jù)插入到另一個(gè)表中的實(shí)現(xiàn)代碼進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-05-05
Workbench連接不上阿里云服務(wù)器Ubuntu的Mysql解決方法(已測)
這兩天為了解決workbench連接不上阿里云服務(wù)器的問題,搞得頭大,網(wǎng)上搜到的教程都大同小異,但唯獨(dú)到我這就是行不通。不過好在最后終于解決了,記錄一下這個(gè)坑爹的過程,另外腳本之家小編特把這些問題整理了一下,看完這一篇文章基本上就解決了2020-02-02

