基于Java編寫emoji表情處理工具類
emoji表情也是使用Unicode編碼的,但UTF8編碼是不支持的。我們?nèi)绻氪鎯moji到數(shù)據(jù)庫,一般有兩種方法,以mysql為例,將數(shù)據(jù)庫編碼從 utf8 改為 utf8mb4,第二種就是做一個轉(zhuǎn)換,將emoji表情轉(zhuǎn)換成另一個字符,所以本文主要來和大家講講如何使用Java實(shí)現(xiàn)處理emoji表情吧
xml
<!-- https://mvnrepository.com/artifact/com.vdurmont/emoji-java -->
<dependency>
<groupId>com.vdurmont</groupId>
<artifactId>emoji-java</artifactId>
<version>5.1.1</version>
</dependency>
java代碼
import java.io.UnsupportedEncodingException;
import java.net.URLDecoder;
import java.net.URLEncoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.lang.StringUtils;
import com.vdurmont.emoji.EmojiParser;
/**
* emoji表情過濾
* @author madaha
*
*/
public class EmojiFilter {
/**
* 判斷是否存在Emoji
* @author madaha
*
* @param codePoint
* @return
*/
private static boolean isEmojiCharacter(char codePoint) {
return (codePoint == 0x0) || (codePoint == 0x9)
|| (codePoint == 0xA) || (codePoint == 0xD)
|| ((codePoint >= 0x20) && (codePoint <= 0xD7FF))
|| ((codePoint >= 0xE000) && (codePoint <= 0xFFFD))
|| ((codePoint >= 0x10000) && (codePoint <= 0x10FFFF));
}
/**
* 過濾emoji 或者 其他非文字類型的字符
* @author madaha
*
* @param source 待過濾字符串
* @return
*/
public static String filterEmoji(String source) {
if (StringUtils.isBlank(source)) {
return source;
}
StringBuilder buf = null;
int len = source.length();
for (int i = 0; i < len; i++) {
char codePoint = source.charAt(i);
if (isEmojiCharacter(codePoint)) {
if (buf == null) {
buf = new StringBuilder(source.length());
}
buf.append(codePoint);
}
}
if (buf == null) {
return source;
} else {
if (buf.length() == len) {
buf = null;
return source;
} else {
return buf.toString();
}
}
}
/**
* @Description 將字符串中的emoji表情轉(zhuǎn)換成可以在utf-8字符集數(shù)據(jù)庫中保存的格式(表情占4個字節(jié),需要utf8mb4字符集)
* @param str 待轉(zhuǎn)換字符串
* @return 轉(zhuǎn)換后字符串
* @throws UnsupportedEncodingException
* exception
*/
public static String emojiConvert1(String str) throws UnsupportedEncodingException {
String patternString = "([\\x{10000}-\\x{10ffff}\ud800-\udfff])";
Pattern pattern = Pattern.compile(patternString);
Matcher matcher = pattern.matcher(str);
StringBuffer sb = new StringBuffer();
while (matcher.find()) {
try {
matcher.appendReplacement(sb, "[[" + URLEncoder.encode(matcher.group(1), "UTF-8") + "]]");
} catch (UnsupportedEncodingException e) {
System.out.println(e);
throw e;
}
}
matcher.appendTail(sb);
// System.out.println("emojiConvert " + str + " to " + sb.toString() + ", len:" + sb.length());
return sb.toString();
}
/**
* @Description 還原utf8數(shù)據(jù)庫中保存的含轉(zhuǎn)換后emoji表情的字符串
* @param str 轉(zhuǎn)換前的字符串
* @return 轉(zhuǎn)換后的字符串
* @throws UnsupportedEncodingException
* exception
*/
public static String emojiRecovery2(String str) throws UnsupportedEncodingException {
String patternString = "\\[\\[(.*?)\\]\\]";
Pattern pattern = Pattern.compile(patternString);
Matcher matcher = pattern.matcher(str);
StringBuffer sb = new StringBuffer();
while (matcher.find()) {
try {
matcher.appendReplacement(sb, URLDecoder.decode(matcher.group(1), "UTF-8"));
} catch (UnsupportedEncodingException e) {
System.out.println(e);
throw e;
}
}
matcher.appendTail(sb);
// System.out.println("emojiRecovery " + str + " to " + sb.toString());
return sb.toString();
}
/**
* emoji表情處理測試方法
* @author madaha
*
* @param args
*/
public static void main(String[] args) {
String str = "emoji表情????輸入測試????";
System.out.println("原始字符為:\n" + str);
System.out.println("to aliases 之后:\n" + EmojiParser.parseToAliases(str));
str = EmojiParser.parseToAliases(str);
System.out.println("還原:\n" + EmojiParser.parseToUnicode(str));
}
}
到此這篇關(guān)于基于Java編寫emoji表情處理工具類的文章就介紹到這了,更多相關(guān)Java處理emoji表情內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
java 實(shí)現(xiàn)多個list 合并成一個去掉重復(fù)的案例
這篇文章主要介紹了java 實(shí)現(xiàn)多個list 合并成一個去掉重復(fù)的案例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-08-08
Netty分布式Server啟動流程服務(wù)端初始化源碼分析
本章主要講解server啟動的關(guān)鍵步驟,?讀者只需要了解server啟動的大概邏輯,?知道關(guān)鍵的步驟在哪個類執(zhí)行即可,?并不需要了解每一步的運(yùn)作機(jī)制,?之后會對每個模塊進(jìn)行深度分析2022-03-03
Spring、Spring?Boot、Spring?Cloud?的區(qū)別與聯(lián)系分析
Spring、SpringBoot和SpringCloud是Java開發(fā)中常用的框架,分別針對企業(yè)級應(yīng)用開發(fā)、快速開發(fā)和分布式系統(tǒng),本文介紹Spring、Spring?Boot、Spring?Cloud?的區(qū)別與聯(lián)系,感興趣的朋友一起看看吧2025-03-03
javaweb實(shí)戰(zhàn)之商城項目開發(fā)(二)
這篇文章主要針對javaweb商城項目開發(fā)進(jìn)行實(shí)戰(zhàn)演習(xí),利用mybatis創(chuàng)建DAO層,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2016-02-02
Mybatis-Plus支持GBase8s分頁查詢的實(shí)現(xiàn)示例
本文主要介紹了使?Mybatis-Plus?支持?GBase8s?的分頁查詢,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01
SpringSecurity導(dǎo)致SpringBoot跨域失效的問題解決
本文主要介紹了SpringSecurity導(dǎo)致SpringBoot跨域失效的問題解決,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01
java springboot郵箱找回密碼功能的實(shí)現(xiàn)講解
這篇文章主要介紹了java springboot郵箱找回密碼功能的實(shí)現(xiàn)講解,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-01-01
SpringBoot框架中Mybatis-plus的簡單使用操作匯總
這篇文章主要介紹了SpringBoot框架中Mybatis-plus的簡單使用,本文通過示例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-02-02
mybatis如何獲取剛剛新插入數(shù)據(jù)的主鍵值id
這篇文章主要介紹了mybatis如何獲取剛剛新插入數(shù)據(jù)的主鍵值id問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08

