UTF-8正則表達(dá)式如何匹配漢字
判斷輸入內(nèi)容是否含有違法字符,請(qǐng)看下面代碼
$str = "編程";
// if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))
//UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) //UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
-----------------------
UTF-8匹配:
在javascript中,要判斷字符串是中文是很簡單的。
比如:
var str = "php編程";
if (/^[\u4e00-\u9fa5]+$/.test(str))
{ alert("該字符串全部是中文");
}
else{ alert("該字符串不全部是中文");
}
php中,是用\x表示十六進(jìn)制數(shù)據(jù)的。
于是,變換成如下的代碼:
$str = "php編程";
if (preg_match("/^[\x4e00-\x9fa5]+$/",$str))
{
print("該字符串全部是中文");
}
else { print("該字符串不全部是中文");
}
貌似不報(bào)錯(cuò)了,判斷的結(jié)果也正確,不過把$str換成“編程”兩字,結(jié)果卻還是顯示“該字符串不全部是中文”,看來這樣的判斷還是不夠準(zhǔn)確。
重要:
查閱了<精通正則表達(dá)式>發(fā)現(xiàn),對(duì)于[\x4e00-\x9fa5]這塊東西,自己做一個(gè)強(qiáng)化的解釋
php的正則中, [\x4e00-\x9fa5],其實(shí)就是 字符和字符組的概念, \x{hex},表達(dá)一個(gè)16進(jìn)制數(shù), 需要注意的是hex 可以是1-2位的,也可以是4位的,但是如果是4位的必須加上大括號(hào),
同時(shí),如果是大于x{FF}的hex,必須和u 修飾符連用,不然會(huì)非法出錯(cuò)
網(wǎng)上只能找到匹配全角字符的正則: ^[\x80-\xff]*^/ ,這里可以不加大括號(hào) [\u4e00-\u9fa5]可以匹配中文,但是PHP又不支持 不過,既然\x表示的十六進(jìn)制數(shù)據(jù),為什么和js里邊提供的范圍\x4e00-\x9fa5不一樣呢?
于是我就換成了下邊的代碼,發(fā)現(xiàn)真的準(zhǔn)確了:
$str = "php編程";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str))
{
print("該字符串全部是中文");
}
else { print("該字符串不全部是中文");
}
知道了php中utf-8編碼下用正則表達(dá)式匹配漢字的最終正確表達(dá)式——/^[\x{4e00}-\x{9fa5}]+$/u, 參考以上文章寫了如下一段測(cè)試代碼(復(fù)制以下代碼保存成.php文件)
<?php $action = trim($_GET['action']);
if($action == "sub") {
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str))
//UTF-8漢字字母數(shù)字下劃線正則表達(dá)式
{
echo "<font color=red>您輸入的[".$str."]含有違法字符</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
} }
?<form method="POST" action="?action=sub"> 輸入字符(數(shù)字,字母,漢字,下劃線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
GBK:
preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str); //GB2312漢字字母數(shù)字下劃線正則表達(dá)式
以上內(nèi)容就是PHP中UTF-8正則表達(dá)式如何匹配漢字的全部內(nèi)容,希望大家喜歡。
相關(guān)文章
php安裝擴(kuò)展mysqli的實(shí)現(xiàn)步驟及報(bào)錯(cuò)解決辦法
這篇文章主要介紹了 php安裝擴(kuò)展mysqli的實(shí)現(xiàn)步驟及報(bào)錯(cuò)解決辦法的相關(guān)資料,希望通過本文能幫助到大家,需要的朋友可以參考下2017-09-09
php視頻拍照上傳頭像功能實(shí)現(xiàn)代碼分享
現(xiàn)在手機(jī)拍照很火,那么如何使用手機(jī)拍照并上傳頭像呢?原因很簡單,就是數(shù)據(jù)傳遞,首先手機(jī)傳遞照片信息,既不是post傳遞也不是get函數(shù)傳遞,這個(gè)另外一種數(shù)據(jù)格式傳遞,使用的是$GLOBALS ['HTTP_RAW_POST_DATA'],需要的朋友可以參考下2015-10-10
Yii2框架數(shù)據(jù)庫簡單的增刪改查語法小結(jié)
這篇文章主要介紹了Yii2框架數(shù)據(jù)庫簡單的增刪改查語法小結(jié),非常不錯(cuò),具有參考借鑒價(jià)值,需要的朋友可以參考下2016-08-08
thinkPHP框架通過Redis實(shí)現(xiàn)增刪改查操作的方法詳解
這篇文章主要介紹了thinkPHP框架通過Redis實(shí)現(xiàn)增刪改查操作的方法,結(jié)合實(shí)例形式較為詳細(xì)的分析了thinkPHP框架針對(duì)redis數(shù)據(jù)庫的配置、連接及CURD操作相關(guān)實(shí)現(xiàn)技巧,需要的朋友可以參考下2019-05-05
PHP實(shí)現(xiàn)微信申請(qǐng)退款流程實(shí)例代碼
本篇文章給大家介紹php實(shí)現(xiàn)微信申請(qǐng)退款流程,使用到官方提供的SDK中的最重要的一個(gè)類文件WxPay.Api.php中提供的refund()方法來實(shí)現(xiàn)的,完整大家大家參考下本文2018-03-03

