mysql 字符串長(zhǎng)度計(jì)算實(shí)現(xiàn)代碼(gb2312+utf8)
更新時(shí)間:2011年12月16日 16:54:13 作者:
PHP對(duì)中文字符串的處理一直困擾于剛剛接觸PHP開發(fā)的新手程序員。下面簡(jiǎn)要的剖析一下PHP對(duì)中文字符串長(zhǎng)度的處
PHP對(duì)中文字符串的處理一直困擾于剛剛接觸PHP開發(fā)的新手程序員。下面簡(jiǎn)要的剖析一下PHP對(duì)中文字符串長(zhǎng)度的處理:
PHP自帶的函數(shù)如strlen()、mb_strlen()都是通過計(jì)算字符串所占字節(jié)數(shù)來統(tǒng)計(jì)字符串長(zhǎng)度的,一個(gè)英文字符占1字節(jié)。例:
$enStr = 'Hello,China!';
echo strlen($enStr); // 輸出:12
而中文則不然,做中文網(wǎng)站一般會(huì)選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站長(zhǎng)的喜愛。gbk與utf-8對(duì)中文的編碼不同,導(dǎo)致中文在gbk與utf-8編碼下所占字節(jié)也有差異。
gbk編碼下每個(gè)中文字符所占字節(jié)為2,例:
$zhStr = '您好,中國(guó)!';
echo strlen($zhStr); // 輸出:12
utf-8編碼下每個(gè)中文字符所占字節(jié)為3,例:
$zhStr = '您好,中國(guó)!';
echo strlen($zhStr); // 輸出:18
那么如何計(jì)算這組中文字符串的長(zhǎng)度呢?有人可能會(huì)說gbk下獲取中文字符串長(zhǎng)度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字符串并不老實(shí),99%的情況會(huì)以中英混合的情況出現(xiàn)。
這是WordPress中的一段代碼,主要思想就是先用正則將字符串分解為個(gè)體單元,然后再計(jì)算單元的個(gè)數(shù)即字符串的長(zhǎng)度,代碼如下(只能處理utf-8編碼下的字符串):
$zhStr = '您好,中國(guó)!';
$str = 'Hello,中國(guó)!';
// 計(jì)算中文字符串長(zhǎng)度
function utf8_strlen($string = null) {
// 將字符串分解為單元
preg_match_all("/./us", $string, $match);
// 返回單元個(gè)數(shù)
return count($match[0]);
}
echo utf8_strlen($zhStr); // 輸出:6
echo utf8_strlen($str); // 輸出:9
utf8_strlen – 獲得UTF8編碼的字符串的長(zhǎng)度
/*
* 用于UTF8編碼的程序
* 獲得字符串的長(zhǎng)度,一個(gè)中文表示3個(gè)長(zhǎng)度
* itlearner注釋
*/
function utf8_strlen($str) {
$count = 0;
for($i = 0; $i < strlen($str); $i++){
$value = ord($str[$i]);
if($value > 127) {
$count++;
if($value >= 192 && $value <= 223) $i++;
elseif($value >= 224 && $value <= 239) $i = $i + 2;
elseif($value >= 240 && $value <= 247) $i = $i + 3;
else die('Not a UTF-8 compatible string');
}
$count++;
}
return $count;
}
PHP自帶的函數(shù)如strlen()、mb_strlen()都是通過計(jì)算字符串所占字節(jié)數(shù)來統(tǒng)計(jì)字符串長(zhǎng)度的,一個(gè)英文字符占1字節(jié)。例:
$enStr = 'Hello,China!';
echo strlen($enStr); // 輸出:12
而中文則不然,做中文網(wǎng)站一般會(huì)選擇兩種編碼:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站長(zhǎng)的喜愛。gbk與utf-8對(duì)中文的編碼不同,導(dǎo)致中文在gbk與utf-8編碼下所占字節(jié)也有差異。
gbk編碼下每個(gè)中文字符所占字節(jié)為2,例:
$zhStr = '您好,中國(guó)!';
echo strlen($zhStr); // 輸出:12
utf-8編碼下每個(gè)中文字符所占字節(jié)為3,例:
$zhStr = '您好,中國(guó)!';
echo strlen($zhStr); // 輸出:18
那么如何計(jì)算這組中文字符串的長(zhǎng)度呢?有人可能會(huì)說gbk下獲取中文字符串長(zhǎng)度除以2,utf-8編碼下除以3不就行了嗎?但是您要考慮字符串并不老實(shí),99%的情況會(huì)以中英混合的情況出現(xiàn)。
這是WordPress中的一段代碼,主要思想就是先用正則將字符串分解為個(gè)體單元,然后再計(jì)算單元的個(gè)數(shù)即字符串的長(zhǎng)度,代碼如下(只能處理utf-8編碼下的字符串):
復(fù)制代碼 代碼如下:
$zhStr = '您好,中國(guó)!';
$str = 'Hello,中國(guó)!';
// 計(jì)算中文字符串長(zhǎng)度
function utf8_strlen($string = null) {
// 將字符串分解為單元
preg_match_all("/./us", $string, $match);
// 返回單元個(gè)數(shù)
return count($match[0]);
}
echo utf8_strlen($zhStr); // 輸出:6
echo utf8_strlen($str); // 輸出:9
utf8_strlen – 獲得UTF8編碼的字符串的長(zhǎng)度
復(fù)制代碼 代碼如下:
/*
* 用于UTF8編碼的程序
* 獲得字符串的長(zhǎng)度,一個(gè)中文表示3個(gè)長(zhǎng)度
* itlearner注釋
*/
function utf8_strlen($str) {
$count = 0;
for($i = 0; $i < strlen($str); $i++){
$value = ord($str[$i]);
if($value > 127) {
$count++;
if($value >= 192 && $value <= 223) $i++;
elseif($value >= 224 && $value <= 239) $i = $i + 2;
elseif($value >= 240 && $value <= 247) $i = $i + 3;
else die('Not a UTF-8 compatible string');
}
$count++;
}
return $count;
}
您可能感興趣的文章:
- mysql計(jì)算時(shí)間差函數(shù)
- Mysql中通過生日計(jì)算年齡的多種方法
- 在php和MySql中計(jì)算時(shí)間差的方法
- Mysql數(shù)據(jù)庫的QPS和TPS的意義和計(jì)算方法
- MySQL幾點(diǎn)重要的性能指標(biāo)計(jì)算和優(yōu)化方法總結(jié)
- 淺談mysql explain中key_len的計(jì)算方法
- MySQL的查詢計(jì)劃中ken_len的值計(jì)算方法
- mysql日期和時(shí)間的間隔計(jì)算實(shí)例分析
- MySQL日期加減函數(shù)詳解
- mysql 觸發(fā)器創(chuàng)建與使用方法示例
- MySQL觸發(fā)器基本用法詳解【創(chuàng)建、查看、刪除等】
- mysql累加計(jì)算實(shí)現(xiàn)方法詳解
相關(guān)文章
MySQL學(xué)習(xí)之?dāng)?shù)據(jù)庫操作DML詳解小白篇
本篇文章非常適合MySQl初學(xué)者,主要為大家講解了MySQL數(shù)據(jù)庫的常用操作,有需要的朋友可以借鑒參考下,希望可以有所幫助,祝大家早日進(jìn)步升職加薪2021-09-09
mysql安裝報(bào)錯(cuò)unknown?variable?‘mysqlx_port=0.0‘簡(jiǎn)單解決過程
這篇文章主要給大家介紹了關(guān)于mysql安裝報(bào)錯(cuò)unknown?variable?‘mysqlx_port=0.0‘的解決過程,文中通過代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2024-08-08
Windows7 64位安裝最新版本MySQL服務(wù)器的圖文教程
本文通過圖文并茂的形式給大家介紹了Windows7 64位安裝最新版本MySQL服務(wù)器的教程,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友參考下吧2018-06-06
mysql?sql_mode數(shù)據(jù)驗(yàn)證檢查方法
sql_mode?會(huì)影響MySQL支持的sql語法以及執(zhí)行的數(shù)據(jù)驗(yàn)證檢查,通過設(shè)置sql_mode?,可以完成不同嚴(yán)格程度的數(shù)據(jù)校驗(yàn),有效地保障數(shù)據(jù)準(zhǔn)確性,這篇文章主要介紹了mysql?sql_mode數(shù)據(jù)驗(yàn)證檢查,需要的朋友可以參考下2023-08-08

