HTML漢字編碼標(biāo)準(zhǔn)介紹
HTML中需要指定網(wǎng)頁(yè)所使用的編碼,一般指定的方式為:
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">
而在新版本HTML5中,也可以使用更簡(jiǎn)單的方式:
<meta charset="UTF-8">
因?yàn)槭澜缟纤玫恼Z(yǔ)言文字很多,為了滿足跨語(yǔ)言、跨平臺(tái)進(jìn)行文本轉(zhuǎn)換、處理的要求,國(guó)際組織研制了Unicode編碼,于1994年正式公布,并不斷升級(jí),提供了1,114,112個(gè)碼點(diǎn),定義了包括古文字符號(hào)在內(nèi)的人類所有可讀字符的字符集。但Unicode編碼為了表示那么多字符,通常使用32位(即4個(gè)字節(jié))來(lái)表示一個(gè)字符,需要占用比較大的存儲(chǔ)空間,對(duì)常用的字符(如ASCII)也需要較長(zhǎng)的編碼,內(nèi)存使用效率比較低。
為此,定義了一種使用8位編碼單元的變寬的編碼格式UTF-8。UTF-8編碼中,一些常用的字符可以使用較少的字節(jié)來(lái)表示,而較少使用的字符則使用較多的字節(jié),提高了編碼占用空間的效率。如ASCII碼仍使用一個(gè)字節(jié)來(lái)表示,這是通過(guò)識(shí)別編碼中一些高位的來(lái)實(shí)現(xiàn)的,它搭建了ASCII編碼和Unicode的橋梁。具體編碼方式為:
·0000~007F:0xxxxxxx,存儲(chǔ)為一個(gè)字節(jié),有7位可表示不同的字符,一般對(duì)應(yīng)ASCII字符
·0080~07FF:110xxxxx,10xxxxxx,存儲(chǔ)為兩個(gè)字節(jié),有11位可表示不同的字符
·0800~FFFF:1110xxxx,10xxxxxx,10xxxxxx,存儲(chǔ)為3個(gè)字節(jié),有16位用來(lái)表示不同的字符
·10000~1FFFFF:11110xxx,10xxxxxx,10xxxxxx,10xxxxxx,存儲(chǔ)為4個(gè)字節(jié),有21位表示不同的字符
可以看到規(guī)律:如果最高位不是0,那么數(shù)字中在0前面的數(shù)字表示一個(gè)序列包括的碼元數(shù)。一個(gè)序列中,第一個(gè)碼元之后的所有碼元都有10前綴。Unicode編碼還有UTF-16、UTF-32等其他的編碼格式,但UTF-8更采用,同樣也可以表示所有的編碼集。
過(guò)去在計(jì)算機(jī)中表示漢字最常用的是GB2312編碼,1980年發(fā)布,全稱為《信息交換用漢字編碼字符集--基本集》,它使用兩個(gè)字節(jié)來(lái)表示一個(gè)漢字,共收入6763個(gè)漢字和682個(gè)非漢字圖形字符,兼容于ASCII字符集。但這種編碼中包含的漢字比較少,不能表示港臺(tái)使用的繁體字,一些非常用字及古書(shū)中的字也無(wú)法表示,實(shí)用中會(huì)感到很多不便。后來(lái),在GB2312基礎(chǔ)上進(jìn)行了擴(kuò)展,也就是GBK編碼標(biāo)準(zhǔn),可以表示繁體字及一些異體字,使用范圍得到擴(kuò)展。
為了適合更廣范圍的應(yīng)用,又發(fā)布了GB18030編碼標(biāo)準(zhǔn),GB18030-2000收錄了27533個(gè)漢字,GB18030-2005則收錄了70244個(gè)漢字,并包含了藏、蒙古、傣、彝、朝鮮、維吾爾文等多種少數(shù)民族文字。GB18030的總編碼空間超過(guò)150萬(wàn)個(gè)碼位,編碼采用單字節(jié)、雙字節(jié)和四字節(jié)對(duì)字符編碼,單字節(jié)部分采用GB/T11383的編碼結(jié)構(gòu)與規(guī)則,使用0x00至0x7F碼位,對(duì)應(yīng)于ASCII碼的相應(yīng)碼位;雙字節(jié)部分,首字節(jié)碼位從0x81至0xFE,尾字節(jié)碼位分別是0x40至0x7E和0x80至0xFE;四字節(jié)部分采用GB/T11383未采用的0x30到0x39作為對(duì)雙字節(jié)編碼擴(kuò)充的后綴,這樣擴(kuò)充的四字節(jié)編碼,其范圍為0x81308130到0xFE39FE39。GB18030編碼還在不斷擴(kuò)充中。
為了更多地表示漢字及一些特殊符號(hào),也為了未來(lái)更好地兼容性,新制作的網(wǎng)頁(yè)最好使用GB18030標(biāo)準(zhǔn),也就是使用下面兩種方式之一指定編碼:
<meta http-equiv="Content-Type" content="text/html;charset=gb18030">
<meta charset="gb18030">
當(dāng)然,為了顯示外國(guó)文字方便,也可以使用國(guó)際通用的UTF-8編碼。
相關(guān)文章
- HTML表格用于在網(wǎng)頁(yè)上展示數(shù)據(jù),通過(guò)標(biāo)簽及其相關(guān)標(biāo)簽來(lái)創(chuàng)建,表格由行和列組成,每一行包含一個(gè)或多個(gè)單元格,單元格可以包含文本、圖像、鏈接等元素,本文將詳細(xì)介紹HTML表格2025-03-12
- 本文介紹了三種禁止HTML頁(yè)面滾動(dòng)的方法:通過(guò)CSS的overflow屬性、使用JavaScript的滾動(dòng)事件監(jiān)聽(tīng)器以及使用CSS的position:fixed屬性,每種方法都有其適用場(chǎng)景和優(yōu)缺點(diǎn),感興2025-02-24

使用HTML和CSS實(shí)現(xiàn)文字鏤空效果的代碼示例
在 Web 開(kāi)發(fā)中,文本的視覺(jué)效果是提升用戶體驗(yàn)的重要因素之一,通過(guò) CSS 技巧,我們可以創(chuàng)造出許多獨(dú)特的效果,例如文字鏤空效果,本文將帶你一步一步實(shí)現(xiàn)一個(gè)簡(jiǎn)單的文字鏤空2024-11-17
Html去除a標(biāo)簽的默認(rèn)樣式的操作代碼
在Html中,a標(biāo)簽?zāi)J(rèn)的超鏈接樣式是藍(lán)色字體配下劃線,這可能不滿足所有設(shè)計(jì)需求,如需去除這些默認(rèn)樣式,可以通過(guò)CSS來(lái)實(shí)現(xiàn),本文給大家介紹Html去除a標(biāo)簽的默認(rèn)樣式的操作代碼2024-09-25HTML文本域如何設(shè)置為禁止用戶手動(dòng)拖動(dòng)
在HTML中,可以通過(guò)設(shè)置CSS的resize屬性為none,來(lái)禁止用戶手動(dòng)拖動(dòng)文本域(textarea)的大小,這種方法簡(jiǎn)單有效,適用于大多數(shù)現(xiàn)代瀏覽器,但需要在老舊瀏覽器中進(jìn)行測(cè)試以確保2024-09-25
如何通過(guò)HTML/CSS 實(shí)現(xiàn)各類進(jìn)度條的功能
本文詳細(xì)介紹了如何利用HTML和CSS實(shí)現(xiàn)多種風(fēng)格的進(jìn)度條,包括基礎(chǔ)的水平進(jìn)度條、環(huán)形進(jìn)度條以及球形進(jìn)度條等,還探討了如何通過(guò)動(dòng)畫(huà)增強(qiáng)視覺(jué)效果,內(nèi)容涵蓋了使用HTML原生標(biāo)簽2024-09-19HTML中Canvas關(guān)鍵知識(shí)點(diǎn)總結(jié)
Canvas 提供了一套強(qiáng)大的 2D 繪圖 API,適用于各種圖形繪制、圖像處理和動(dòng)畫(huà)制作,可以幫助你創(chuàng)建復(fù)雜且高效的網(wǎng)頁(yè)圖形應(yīng)用,這篇文章主要介紹了HTML中Canvas關(guān)鍵知識(shí)點(diǎn)總結(jié)2024-06-03
html table+css實(shí)現(xiàn)可編輯表格的示例代碼
本文主要介紹了html table+css實(shí)現(xiàn)可編輯表格的示例代碼,主要使用HTML5的contenteditable屬性,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)2024-03-06
HTML中使用Flex布局實(shí)現(xiàn)雙行夾批效果
本文主要介紹了HTML中使用Flex布局實(shí)現(xiàn)雙行夾批效果,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)2024-02-22
HTML+CSS實(shí)現(xiàn)炫酷登錄切換的項(xiàng)目實(shí)踐
在網(wǎng)站開(kāi)發(fā)中,登錄頁(yè)面是必不可少的一部分,本文就來(lái)介紹一下HTML+CSS實(shí)現(xiàn)登錄切換,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需2024-02-02



