Java 完美判斷中文字符的方法
Java判斷一個(gè)字符串是否有中文一般情況是利用Unicode編碼(CJK統(tǒng)一漢字的編碼區(qū)間:0x4e00–0x9fbb)的正則來(lái)做判斷,但是其實(shí)這個(gè)區(qū)間來(lái)判斷中文不是非常精確,因?yàn)橛行┲形牡臉?biāo)點(diǎn)符號(hào)比如:,。等等是不能識(shí)別的。
以下是比較完善的判斷方法:CharUtil.java
import java.util.regex.Pattern;
public class CharUtil {
public static void main(String[] args) {
String[] strArr = new String[] { "www.micmiu.com", "!@#$%^&*()_+{}[]|\"'?/:;<>,.", "?。ぁǎ?;“”‘'《》,。?、", "不要啊", "やめて", "韓佳人", "???" };
for (String str : strArr) {
System.out.println("===========> 測(cè)試字符串:" + str);
System.out.println("正則判斷結(jié)果:" + isChineseByREG(str) + " -- " + isChineseByName(str));
System.out.println("Unicode判斷結(jié)果 :" + isChinese(str));
System.out.println("詳細(xì)判斷列表:");
char[] ch = str.toCharArray();
for (int i = 0; i < ch.length; i++) {
char c = ch[i];
System.out.println(c + " --> " + (isChinese(c) ? "是" : "否"));
}
}
}
// 根據(jù)Unicode編碼完美的判斷中文漢字和符號(hào)
private static boolean isChinese(char c) {
Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_B
|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS
|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {
return true;
}
return false;
}
// 完整的判斷中文漢字和符號(hào)
public static boolean isChinese(String strName) {
char[] ch = strName.toCharArray();
for (int i = 0; i < ch.length; i++) {
char c = ch[i];
if (isChinese(c)) {
return true;
}
}
return false;
}
// 只能判斷部分CJK字符(CJK統(tǒng)一漢字)
public static boolean isChineseByREG(String str) {
if (str == null) {
return false;
}
Pattern pattern = Pattern.compile("[\\u4E00-\\u9FBF]+");
return pattern.matcher(str.trim()).find();
}
// 只能判斷部分CJK字符(CJK統(tǒng)一漢字)
public static boolean isChineseByName(String str) {
if (str == null) {
return false;
}
// 大小寫(xiě)不同:\\p 表示包含,\\P 表示不包含
// \\p{Cn} 的意思為 Unicode 中未被定義字符的編碼,\\P{Cn} 就表示 Unicode中已經(jīng)被定義字符的編碼
String reg = "\\p{InCJK Unified Ideographs}&&\\P{Cn}";
Pattern pattern = Pattern.compile(reg);
return pattern.matcher(str.trim()).find();
}
}
- Java實(shí)現(xiàn)的最大匹配分詞算法詳解
- java中文分詞之正向最大匹配法實(shí)例代碼
- Java正則表達(dá)式過(guò)濾出字母、數(shù)字和中文
- java 逐行讀取txt文本如何解決中文亂碼
- java頁(yè)面中文亂碼的解決辦法
- java實(shí)現(xiàn)驗(yàn)證碼類生成中文驗(yàn)證碼
- 多模字符串匹配算法原理及Java實(shí)現(xiàn)代碼
- Java正則表達(dá)式實(shí)現(xiàn)在文本中匹配查找換行符的方法【經(jīng)典實(shí)例】
- Java基于正則表達(dá)式實(shí)現(xiàn)查找匹配的文本功能【經(jīng)典實(shí)例】
- Java基于正則表達(dá)式實(shí)現(xiàn)的替換匹配文本功能【經(jīng)典實(shí)例】
- Java實(shí)現(xiàn)的雙向匹配分詞算法示例
相關(guān)文章
Spring JPA 增加字段執(zhí)行異常問(wèn)題及解決
這篇文章主要介紹了Spring JPA 增加字段執(zhí)行異常問(wèn)題及解決,具有很好的參考價(jià)值,2022-06-06
SpringBoot之自定義Filter獲取請(qǐng)求參數(shù)與響應(yīng)結(jié)果案例詳解
這篇文章主要介紹了SpringBoot之自定義Filter獲取請(qǐng)求參數(shù)與響應(yīng)結(jié)果案例詳解,本篇文章通過(guò)簡(jiǎn)要的案例,講解了該項(xiàng)技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-09-09
Java 數(shù)組內(nèi)置函數(shù)toArray詳解
這篇文章主要介紹了Java 數(shù)組內(nèi)置函數(shù)toArray詳解,文本詳細(xì)的講解了toArray底層的代碼和文檔,需要的朋友可以參考下2021-06-06
SpringBoot集成tika實(shí)現(xiàn)word轉(zhuǎn)html的操作代碼
Tika是一個(gè)內(nèi)容分析工具,自帶全面的parser工具類,能解析基本所有常見(jiàn)格式的文件,得到文件的metadata,content等內(nèi)容,返回格式化信息,本文給大家介紹了SpringBoot集成tika實(shí)現(xiàn)word轉(zhuǎn)html的操作,需要的朋友可以參考下2024-06-06
解決mapper自動(dòng)裝配識(shí)別不了,Could not autowire.No beans&
文章介紹了在使用MyBatisX插件和MybatisPlus自動(dòng)生成代碼后,如何解決Spring Boot項(xiàng)目中自動(dòng)注入`UserMapper`時(shí)報(bào)錯(cuò)的問(wèn)題,主要方法包括在主配置類或啟動(dòng)類上添加`@MapperScan`注解,指定Mapper文件夾所在的包路徑,以及在Mapper類上添加`@Repository`注解2024-11-11
解決java 分割字符串成數(shù)組時(shí),小圓點(diǎn)不能直接進(jìn)行分割的問(wèn)題
這篇文章主要介紹了解決java 分割字符串成數(shù)組時(shí),小圓點(diǎn)不能直接進(jìn)行分割的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-12-12
java中break和continue區(qū)別及使用場(chǎng)合分析
本文力圖通過(guò)實(shí)例加使用場(chǎng)合詳解來(lái)引導(dǎo)菜鳥(niǎo)重新認(rèn)識(shí)break和continue語(yǔ)句,需要的朋友可以參考下2014-01-01
詳解Java編程中protected修飾符與static修飾符的作用
這篇文章主要介紹了Java編程中protected關(guān)鍵字與static關(guān)鍵字的作用,是Java入門學(xué)習(xí)中的基礎(chǔ)知識(shí),需要的朋友可以參考下2016-01-01

