Java漢字轉(zhuǎn)拼音類庫Pinyin4j詳細(xì)使用方法與實例
漢字轉(zhuǎn)拼音類庫Pinyin4j一般用法
pinyin4j的使用很方便,一般轉(zhuǎn)換只需要使用PinyinHelper類的靜態(tài)工具方法即可:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉'); //該類還有其他的拼音轉(zhuǎn)換形式,但是基本上用不到,就不介紹了
返回的數(shù)組即是該字符的拼音,如上例就是pinyin[0]=liu2,后面的數(shù)字代表聲調(diào),聲調(diào)為5表示輕讀,無聲調(diào)。之所謂返回數(shù)組,是因為被判定的漢字有可能有多個讀音。如果輸入的參數(shù)不是漢字,則返回null。
拼音格式化
如果對于拼音轉(zhuǎn)換后的結(jié)果有一些特定的格式要求目前pinyin4j支持:
聲調(diào)格式化。例如:“劉”字的格式化后為“l(fā)iu2”或“l(fā)iu”或“l(fā)iú”
對特殊拼音ü的的顯示格式。例如“u:”或“v”或“ü”
大小寫的轉(zhuǎn)換。例如:“l(fā)iu2”或“LIU2”
以上這些格式可以混合使用,下面就來介紹具體的使用方法,首先需要創(chuàng)建格式化對象HanyuPinyinOutputFormat,例如:
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
然后分別調(diào)用outputFormat的set方法設(shè)置上述一些格式要求:
設(shè)置聲調(diào)格式:
outputFormat.setToneType(HanyuPinyinToneType);
方法參數(shù)HanyuPinyinToneType有以下常量對象:
HanyuPinyinToneType.WITH_TONE_NUMBER 用數(shù)字表示聲調(diào),例如:liu2
HanyuPinyinToneType.WITHOUT_TONE 無聲調(diào)表示,例如:liu
HanyuPinyinToneType.WITH_TONE_MARK 用聲調(diào)符號表示,例如:liú
設(shè)置特殊拼音ü的顯示格式:
outputFormat.setVCharType(HanyuPinyinVCharType);
方法參數(shù)HanyuPinyinVCharType有以下常量對象:
HanyuPinyinVCharType.WITH_U_AND_COLON 以U和一個冒號表示該拼音,例如:lu:
HanyuPinyinVCharType.WITH_V 以V表示該字符,例如:lv
HanyuPinyinVCharType.WITH_U_UNICODE 以ü表示
設(shè)置大小寫格式
outputFormat.setCaseType(HanyuPinyinCaseType);
HanyuPinyinCaseType.LOWERCASE 轉(zhuǎn)換后以全小寫方式輸出
HanyuPinyinCaseType.UPPERCASE 轉(zhuǎn)換后以全大寫方式輸出
設(shè)置好格式對象后還是利用上述的工具類方法進(jìn)行拼音轉(zhuǎn)換,只不過需要將格式化對象當(dāng)成方法參數(shù)傳入轉(zhuǎn)換方法,告知要轉(zhuǎn)換的格式要求:
String[] pinyin = PinyinHelper.toHanyuPinyinStringArray(‘劉', outputFormat);
但該方法會有異常拋出,注意處理。
示例
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
public static void main(String[] args) {
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class Test {
public static void main(String[] args) {
HanyuPinyinOutputFormat outputFormat = new HanyuPinyinOutputFormat();
outputFormat.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
outputFormat.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
outputFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);
try {
System.out.println(concatPinyinStringArray(PinyinHelper.toHanyuPinyinStringArray('劉',outputFormat)));
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
private static String concatPinyinStringArray(String[] pinyinArray)
{
StringBuffer pinyinStrBuf = new StringBuffer();
if ((null != pinyinArray) && (pinyinArray.length > 0))
{
for (int i = 0; i < pinyinArray.length; i++)
{
pinyinStrBuf.append(pinyinArray[i]);
pinyinStrBuf.append(System.getProperty("line.separator"));
}
}
String outputString = pinyinStrBuf.toString();
return outputString;
}
}
輸出結(jié)果為:LIú
其他
PinyinHelper還有其他的靜態(tài)方法,但示例和講解中使用的方法是常見的拼音格式,因此其他靜態(tài)方法我沒有調(diào)研其含義。
貌似支持生僻字,我試過很怪異的字,都可以將其讀音拼寫出來,因此這個工具包還是很強的。
拼音工具
package cn.itcast.bos.utils;
import java.util.Arrays;
import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;
public class PinYin4jUtils {
/**
* 將字符串轉(zhuǎn)換成拼音數(shù)組
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src) {
return stringToPinyin(src, false, null);
}
/**
* 將字符串轉(zhuǎn)換成拼音數(shù)組
*
* @param src
* @return
*/
public static String[] stringToPinyin(String src, String separator) {
return stringToPinyin(src, true, separator);
}
/**
* 將字符串轉(zhuǎn)換成拼音數(shù)組
*
* @param src
* @param isPolyphone
* 是否查出多音字的所有拼音
* @param separator
* 多音字拼音之間的分隔符
* @return
*/
public static String[] stringToPinyin(String src, boolean isPolyphone,
String separator) {
// 判斷字符串是否為空
if ("".equals(src) || null == src) {
return null;
}
char[] srcChar = src.toCharArray();
int srcCount = srcChar.length;
String[] srcStr = new String[srcCount];
for (int i = 0; i < srcCount; i++) {
srcStr[i] = charToPinyin(srcChar[i], isPolyphone, separator);
}
return srcStr;
}
/**
* 將單個字符轉(zhuǎn)換成拼音
*
* @param src
* @return
*/
public static String charToPinyin(char src, boolean isPolyphone,
String separator) {
// 創(chuàng)建漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設(shè)置,大小寫,音標(biāo)方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
StringBuffer tempPinying = new StringBuffer();
// 如果是中文
if (src > 128) {
try {
// 轉(zhuǎn)換得出結(jié)果
String[] strs = PinyinHelper.toHanyuPinyinStringArray(src,
defaultFormat);
// 是否查出多音字,默認(rèn)是查出多音字的第一個字符
if (isPolyphone && null != separator) {
for (int i = 0; i < strs.length; i++) {
tempPinying.append(strs[i]);
if (strs.length != (i + 1)) {
// 多音字之間用特殊符號間隔起來
tempPinying.append(separator);
}
}
} else {
tempPinying.append(strs[0]);
}
} catch (BadHanyuPinyinOutputFormatCombination e) {
e.printStackTrace();
}
} else {
tempPinying.append(src);
}
return tempPinying.toString();
}
public static String hanziToPinyin(String hanzi) {
return hanziToPinyin(hanzi, " ");
}
/**
* 將漢字轉(zhuǎn)換成拼音
*
* @param hanzi
* @param separator
* @return
*/
public static String hanziToPinyin(String hanzi, String separator) {
// 創(chuàng)建漢語拼音處理類
HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();
// 輸出設(shè)置,大小寫,音標(biāo)方式
defaultFormat.setCaseType(HanyuPinyinCaseType.LOWERCASE);
defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);
String pinyingStr = "";
try {
pinyingStr = PinyinHelper.toHanyuPinyinString(hanzi, defaultFormat,
separator);
} catch (BadHanyuPinyinOutputFormatCombination e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return pinyingStr;
}
/**
* 將字符串?dāng)?shù)組轉(zhuǎn)換成字符串
*
* @param str
* @param separator
* 各個字符串之間的分隔符
* @return
*/
public static String stringArrayToString(String[] str, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < str.length; i++) {
sb.append(str[i]);
if (str.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 簡單的將各個字符數(shù)組之間連接起來
*
* @param str
* @return
*/
public static String stringArrayToString(String[] str) {
return stringArrayToString(str, "");
}
/**
* 將字符數(shù)組轉(zhuǎn)換成字符串
*
* @param str
* @param separator
* 各個字符串之間的分隔符
* @return
*/
public static String charArrayToString(char[] ch, String separator) {
StringBuffer sb = new StringBuffer();
for (int i = 0; i < ch.length; i++) {
sb.append(ch[i]);
if (ch.length != (i + 1)) {
sb.append(separator);
}
}
return sb.toString();
}
/**
* 將字符數(shù)組轉(zhuǎn)換成字符串
*
* @param str
* @return
*/
public static String charArrayToString(char[] ch) {
return charArrayToString(ch, " ");
}
/**
* 取漢字的首字母
*
* @param src
* @param isCapital
* 是否是大寫
* @return
*/
public static char[] getHeadByChar(char src, boolean isCapital) {
// 如果不是漢字直接返回
if (src <= 128) {
return new char[] { src };
}
// 獲取所有的拼音
String[] pinyingStr = PinyinHelper.toHanyuPinyinStringArray(src);
// 創(chuàng)建返回對象
int polyphoneSize = pinyingStr.length;
char[] headChars = new char[polyphoneSize];
int i = 0;
// 截取首字符
for (String s : pinyingStr) {
char headChar = s.charAt(0);
// 首字母是否大寫,默認(rèn)是小寫
if (isCapital) {
headChars[i] = Character.toUpperCase(headChar);
} else {
headChars[i] = headChar;
}
i++;
}
return headChars;
}
/**
* 取漢字的首字母(默認(rèn)是大寫)
*
* @param src
* @return
*/
public static char[] getHeadByChar(char src) {
return getHeadByChar(src, true);
}
/**
* 查找字符串首字母
*
* @param src
* @return
*/
public static String[] getHeadByString(String src) {
return getHeadByString(src, true);
}
/**
* 查找字符串首字母
*
* @param src
* @param isCapital
* 是否大寫
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital) {
return getHeadByString(src, isCapital, null);
}
/**
* 查找字符串首字母
*
* @param src
* @param isCapital
* 是否大寫
* @param separator
* 分隔符
* @return
*/
public static String[] getHeadByString(String src, boolean isCapital,
String separator) {
char[] chars = src.toCharArray();
String[] headString = new String[chars.length];
int i = 0;
for (char ch : chars) {
char[] chs = getHeadByChar(ch, isCapital);
StringBuffer sb = new StringBuffer();
if (null != separator) {
int j = 1;
for (char ch1 : chs) {
sb.append(ch1);
if (j != chs.length) {
sb.append(separator);
}
j++;
}
} else {
sb.append(chs[0]);
}
headString[i] = sb.toString();
i++;
}
return headString;
}
public static void main(String[] args) {
// pin4j 簡碼 和 城市編碼
String s1 = "中華人民共和國";
String[] headArray = getHeadByString(s1); // 獲得每個漢字拼音首字母
System.out.println(Arrays.toString(headArray));
String s2 ="長城" ;
System.out.println(Arrays.toString(stringToPinyin(s2,true,",")));
String s3 ="長";
System.out.println(Arrays.toString(stringToPinyin(s3,true,",")));
}
}
更多關(guān)于Java漢字轉(zhuǎn)拼音類庫Pinyin4j詳細(xì)使用方法與實例請查看下面的相關(guān)鏈接
- ASP.NET Core使用微軟官方類庫實現(xiàn)漢字轉(zhuǎn)拼音
- swift如何利用系統(tǒng)庫將漢字轉(zhuǎn)換為拼音詳解
- JavaScript實現(xiàn)漢字轉(zhuǎn)換為拼音的庫文件示例
- python實現(xiàn)將漢字轉(zhuǎn)換成漢語拼音的庫
- asp.net 根據(jù)漢字的拼音首字母搜索數(shù)據(jù)庫(附 LINQ 調(diào)用方法)
- python munch庫的使用解析
- 關(guān)于python3安裝pip及requests庫的導(dǎo)入問題
- python使用Streamlit庫制作Web可視化頁面
- 教你學(xué)會通過python的matplotlib庫繪圖
- 教你使用Python pypinyin庫實現(xiàn)漢字轉(zhuǎn)拼音
相關(guān)文章
Java整數(shù)和字符串相互轉(zhuǎn)化實例詳解
這篇文章主要介紹了Java整數(shù)和字符串相互轉(zhuǎn)化實例詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-02-02
使用IDEA啟動項目遇見ClassNotFoundException的解決方案
這篇文章主要介紹了使用IDEA啟動項目遇見ClassNotFoundException的正確解決方案,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06
Prometheus監(jiān)控Springboot程序的實現(xiàn)方法
這篇文章主要介紹了Prometheus監(jiān)控Springboot程序的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
java.sql.SQLRecoverableException關(guān)閉的連接異常問題及解決辦法
當(dāng)數(shù)據(jù)庫連接池中的連接被創(chuàng)建而長時間不使用的情況下,該連接會自動回收并失效,就導(dǎo)致客戶端程序報“ java.sql.SQLException: Io 異常: Connection reset” 或“java.sql.SQLException 關(guān)閉的連接”異常問題,下面給大家分享解決方案,一起看看吧2024-03-03
java利用url實現(xiàn)網(wǎng)頁內(nèi)容的抓取
本文主要介紹了java利用url實現(xiàn)網(wǎng)頁內(nèi)容抓取的示例。具有很好的參考價值。下面跟著小編一起來看下吧2017-03-03
使用java實現(xiàn)BBS論壇發(fā)送郵件過程詳解
這篇文章主要介紹了使用java發(fā)送郵件過程詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04

