Java代碼實(shí)現(xiàn)隨機(jī)生成漢字的方法
一、背景知識(shí)
GB 2312-80 是中國(guó)國(guó)家標(biāo)準(zhǔn)簡(jiǎn)體中文字符集,全稱(chēng)《信息交換用漢字編碼字符集·基本集》,由中國(guó)國(guó)家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實(shí)施。GB2312 編碼通行于中國(guó)大陸;新加坡等地也采用此編碼。中國(guó)大陸幾乎所有的中文系統(tǒng)和國(guó)際化的軟件都支持 GB 2312。
GB2312 標(biāo)準(zhǔn)共收錄 6763 個(gè)漢字,其中一級(jí)漢字 3755 個(gè),二級(jí)漢字 3008 個(gè);同時(shí)收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語(yǔ)西里爾字母在內(nèi)的 682 個(gè)字符。GB2312 的出現(xiàn),基本滿足了漢字的計(jì)算機(jī)處理需要,它所收錄的漢字已經(jīng)覆蓋中國(guó)大陸 99.75% 的使用頻率。對(duì)于人名、古漢語(yǔ)等方面出現(xiàn)的罕用字,GB2312 不能處理,這導(dǎo)致了后來(lái) GBK 及 GB18030 漢字字符集的出現(xiàn)。
GB2312 中對(duì)所收漢字進(jìn)行了“分區(qū)”處理,每區(qū)含有 94 個(gè)漢字/符號(hào)。這種表示方式也稱(chēng)為區(qū)位碼。
- 01 - 09 區(qū)為特殊符號(hào)。
- 16 - 55 區(qū)為一級(jí)漢字,按拼音排序。
- 56 - 87 區(qū)為二級(jí)漢字,按部首/筆畫(huà)排序。
- 10 - 15 區(qū)及 88 - 94 區(qū)則未有編碼。舉例來(lái)說(shuō),“啊”字是 GB2312 之中的第一個(gè)漢字,它的區(qū)位碼就是 1601。
每個(gè)漢字及符號(hào)以?xún)蓚€(gè)字節(jié)來(lái)表示。第一個(gè)字節(jié)稱(chēng)為“高位字節(jié)”,第二個(gè)字節(jié)稱(chēng)為“低位字節(jié)”。“高位字節(jié)”使用了 0xA1 - 0xF7(把 01 - 87 區(qū)的區(qū)號(hào)加上 0xA0),“低位字節(jié)”使用了 0xA1 - 0xFE(把 01 - 94 位的位號(hào)加上 0xA0)。 由于一級(jí)漢字從 16 區(qū)起始,漢字區(qū)的“高位字節(jié)”的范圍是 0xB0 - 0xF7,“低位字節(jié)”的范圍是 0xA1 - 0xFE,占用的碼位是 72 * 94 = 6768。其中有 5 個(gè)空位是 D7FA - D7FE。例如“啊”字在大多數(shù)程序中,會(huì)以?xún)蓚€(gè)字節(jié),0xB0(第一個(gè)字節(jié))0xA1(第二個(gè)字節(jié))儲(chǔ)存。(與區(qū)位碼對(duì)比:0xB0 = 0xA0 + 16, 0xA1 = 0xA0 + 1)。
國(guó)家標(biāo)準(zhǔn) GB 18030-2005《信息技術(shù) 中文編碼字符集》,是中華人民共和國(guó)現(xiàn)時(shí)最新的內(nèi)碼字集,與 GB 2312-1980 完全兼容,與 GBK 基本兼容,支持 GB 13000 及 Unicode 的全部統(tǒng)一漢字,共收錄漢字 70244 個(gè)?,F(xiàn)行版本為國(guó)家質(zhì)量監(jiān)督檢驗(yàn)總局和中國(guó)國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)于2005年11月8日發(fā)布,2006年5月1日實(shí)施,為在中國(guó)境內(nèi)所有軟件產(chǎn)品支持的強(qiáng)制標(biāo)準(zhǔn)。
二、隨機(jī)生成常用漢字的 C# 程序
新建Java項(xiàng)目,創(chuàng)建代碼片段:
import java.io.UnsupportedEncodingException;
import java.util.Random;
/**
* 隨機(jī)生成常見(jiàn)的漢字
*
* @author xuliugen
*
*/
public class GeneCharTest {
public static void main(String[] args) {
for (int i = 1; i < 24; i++) {
System.out.print(getRandomChar() + " ");
}
}
private static char getRandomChar() {
String str = "";
int hightPos; //
int lowPos;
Random random = new Random();
hightPos = (176 + Math.abs(random.nextInt(39)));
lowPos = (161 + Math.abs(random.nextInt(93)));
byte[] b = new byte[2];
b[0] = (Integer.valueOf(hightPos)).byteValue();
b[1] = (Integer.valueOf(lowPos)).byteValue();
try {
str = new String(b, "GBK");
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
System.out.println("錯(cuò)誤");
}
return str.charAt(0);
}
}
運(yùn)行結(jié)果:

總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對(duì)腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請(qǐng)查看下面相關(guān)鏈接
- 如何用java生成指定范圍的隨機(jī)數(shù)
- Java中生成隨機(jī)數(shù)的實(shí)現(xiàn)方法總結(jié)
- java實(shí)現(xiàn)隨機(jī)生成UUID
- Java生成含字母和數(shù)字的6位隨機(jī)字符串
- Java隨機(jī)生成手機(jī)短信驗(yàn)證碼的方法
- java隨機(jī)生成10位數(shù)的字符串ID
- java隨機(jī)生成字符串(字符隨機(jī)生成類(lèi) 生成隨機(jī)字符組合)
- java隨機(jī)生成8位數(shù)授權(quán)碼的實(shí)例
- Java 生成隨機(jī)單據(jù)號(hào)的實(shí)現(xiàn)示例
相關(guān)文章
Spring4下validation數(shù)據(jù)校驗(yàn)無(wú)效(maven)的解決
這篇文章主要介紹了Spring4下validation數(shù)據(jù)校驗(yàn)無(wú)效(maven)的解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-06-06
SpringBoot定時(shí)任務(wù)設(shè)計(jì)之時(shí)間輪案例原理詳解
這篇文章主要為大家介紹了SpringBoot定時(shí)任務(wù)設(shè)計(jì)之時(shí)間輪案例原理詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-10-10
Spring框架整合Java Web Token問(wèn)題
這篇文章主要介紹了Spring框架整合Java Web Token問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-09-09
java調(diào)用相互依賴(lài)的dll的處理方法
大家好,本篇文章主要講的是java調(diào)用相互依賴(lài)的dll的處理方法,感興趣的同學(xué)趕快來(lái)看一看吧,對(duì)你有幫助的話記得收藏一下2022-01-01
java線程的中斷和同步問(wèn)題的實(shí)現(xiàn)
本文主要介紹了java線程的中斷和同步問(wèn)題的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2024-07-07

