Lua中獲取utf8字符串長度的方法和自定義函數(shù)

更新時間：2015年04月21日 09:08:34 投稿：junjie

這篇文章主要介紹了Lua中獲取utf8字符串長度的方法和自定義函數(shù),本文給出了代碼實例并講解了UTF8的編碼規(guī)則,需要的朋友可以參考下

--- 獲取utf8編碼字符串正確長度的方法

-- @param str

-- @return number

function utfstrlen(str)

local len = #str;

local left = len;

local cnt = 0;

local arr={0,0xc0,0xe0,0xf0,0xf8,0xfc};

while left ~= 0 do

local tmp=string.byte(str,-left);

local i=#arr;

while arr[i] do

if tmp>=arr[i] then left=left-i;break;end

i=i-1;

end

cnt=cnt+1;

end

return cnt;

end

lua 的string庫不支持處理utf-8編碼的漢字。用lua要處理漢字還是很費勁的。

UTF8的編碼規(guī)則：

1. 字符的第一個字節(jié)范圍： 0x00—0x7F(0-127),或者 0xC2—0xF4(194-244); UTF8 是兼容 ascii 的，所以 0~127 就和 ascii 完全一致
2. 0xC0, 0xC1,0xF5—0xFF(192, 193 和 245-255)不會出現(xiàn)在UTF8編碼中
3. 0x80—0xBF(128-191)只會出現(xiàn)在第二個及隨后的編碼中(針對多字節(jié)編碼，如漢字)

這樣我們可以利用lua強大的模式匹配，來實現(xiàn)我們要的效果，關(guān)鍵的處理有這么兩個：
1. local _, count = string.gsub(str, "[^\128-\193]", ""),用來得到str中的字符數(shù)
2. for uchar in string.gfind(str, "[%z\1-\127\194-\244][\128-\191]*") do tab[#tab+1] = uchar end,用來把str中的每個字符映射到tab中

您可能感興趣的文章:

Lua獲取utf8字符串長度和字符串截取并用...代替

相關(guān)文章

Lua學(xué)習(xí)筆記之表和函數(shù)
這篇文章主要介紹了Lua學(xué)習(xí)筆記之表和函數(shù),本文在代碼中使用大量注釋講解了Lua的表和函數(shù)的使用,需要的朋友可以參考下
2014-09-09
詳解Lua中的變量相關(guān)知識點
這篇文章主要介紹了Lua中的變量相關(guān)知識點,是Lua入門中的基礎(chǔ)知識,需要的朋友可以參考下
2015-05-05
Lua腳本語言入門筆記
這篇文章主要介紹了Lua腳本語言入門筆記,本文講解了什么是Lua、Lua里的注釋、Lua里的變量、Lua里的運算符、Lua里的數(shù)據(jù)類型、Lua里的代碼塊、Lua里的關(guān)系類型、Lua里的函數(shù)、Lua里的類等內(nèi)容,需要的朋友可以參考下
2014-12-12
lua開發(fā)中實現(xiàn)MVC框架的簡單應(yīng)用
最近的游戲項目中使用了lua腳本來開發(fā)，項目中用到了MVC框架，最近有朋友問我怎么弄，在這里簡單分享一下思路和一些開發(fā)中的技巧。有需要的小伙伴可以參考下。
2015-04-04
Lua教程（八）：數(shù)據(jù)持久化
這篇文章主要介紹了Lua教程（八）：數(shù)據(jù)持久化,本文講解了數(shù)據(jù)文件持久化、序列化兩部份內(nèi)容,需要的朋友可以參考下
2015-04-04
深入探究Lua中的解析表達式
這篇文章主要介紹了深入探究Lua中的解析表達式,對于其語法部分的說明和示例都超詳細(xì),極力推薦此文!需要的朋友可以參考下
2015-07-07
Lua協(xié)同程序coroutine的簡介及優(yōu)缺點
今天小編就為大家分享一篇關(guān)于Lua協(xié)同程序coroutine的簡介及優(yōu)缺點，小編覺得內(nèi)容挺不錯的，現(xiàn)在分享給大家，具有很好的參考價值，需要的朋友一起跟隨小編來看看吧
2018-10-10
Lua變量類型簡明總結(jié)
這篇文章主要介紹了Lua變量類型簡明總結(jié),本文總結(jié)了Lua中的6種變量類型,并一一說明,需要的朋友可以參考下
2014-10-10
Lua數(shù)據(jù)類型介紹
這篇文章主要介紹了Lua數(shù)據(jù)類型介紹,本文講解了Lua中的nil（空）、boolean（布爾）、number（數(shù)字）、string（字符串）、table（表）、function（函數(shù)）、thread（線程）、userdata（自定義類型）等數(shù)據(jù)類型,需要的朋友可以參考下
2014-12-12
Lua中的類編程代碼實例
這篇文章主要介紹了Lua中的類編程代碼實例,本文直接用代碼講解類的創(chuàng)建、類的實例化、類的方法調(diào)用、類的繼承、類的多重繼承等面向?qū)ο缶幊谭椒?需要的朋友可以參考下
2015-04-04