java 字符串截取的實例詳解

更新時間：2017年09月21日 10:29:22 作者：海那邊的小萌男

這篇文章主要介紹了java 字符串截取的實例詳解的相關資料,希望通過本文能幫助到大家，需要的朋友可以參考下

java 字符串截取的實例詳解

題目

在java中，字符串“abcd”與字符串“ab你好”的長度是一樣，都是四個字符。

但對應的字節(jié)數(shù)不同，一個漢字占兩個字節(jié)。

定義一個方法，按照指定的字節(jié)數(shù)來取子串。

如：對于“ab你好”，如果取三個字節(jié)，那么子串就是ab與“你”字的半個，那么半個就要舍棄。

如果取四個字節(jié)就是“ab你”，取五個字節(jié)還是“ab你”。

僅考慮GBK和utf-8編碼

實例代碼：

import java.io.UnsupportedEncodingException;

import org.junit.Test;

/**
 * @author<a href="mailto:953801304@qq.com" rel="external nofollow" >胡龍華</a>
 * @version 2017-4-4 下午1:08:45
 * @fileName StringCut.java
 */
public class StringCut {

  @Test
  public void analyze(){
    String str1 = "你好abc";
    byte[] bs1=null;
    byte[] bs2=null;
    try {
       bs1 = str1.getBytes("GBK");
       System.out.println("---GBK---");
       for(byte b:bs1){
         System.out.print(b+" ");
       }
       System.out.println();
      //-60 -29 -70 -61 97 98 99 
      // 發(fā)現(xiàn)規(guī)律，再gbk中一個中文漢字 都是以兩個字節(jié) 小于0的數(shù)存儲
       bs2 = str1.getBytes("utf-8");
       System.out.println("---utf-8---");
       for(byte b:bs2){
         System.out.print(b+" ");
       }
      //-28 -67 -96 -27 -91 -67 97 98 99 
      // 發(fā)現(xiàn)規(guī)律，在utf-8中一個中文漢字 是以三個字節(jié) 小于0 的數(shù)存儲
    } catch (UnsupportedEncodingException e) {
      e.printStackTrace();
    }
  }
  /**
   * 思路：從第len個往前數(shù)，連續(xù)2的倍數(shù)個負數(shù)則全部輸出，單數(shù)個則去掉最后一個輸出
   * @param str
   * @param len
   * @return
   */
  private static String StringCutByGBK(String str,int len){
    byte[] bs = null;
    try {
      int count = 0;
      bs = str .getBytes("GBK");
      for(int i=len-1;i>=0;i--){
        if(bs[i]<0){
          count++;
        }else{
          break;
        }
        // 0  1  2  3  4 5  6 7  8  9  10 11 12  
      }  //-60 -29 -70 -61 -80 -95 97 98 99 -76 -17 -72 -25 
      if(count%2==0){
        String s=new String(bs, 0, len, "GBK");
        System.out.println("截取"+len+"個字符："+s);
      }else{
        String s=new String(bs, 0, len-1, "GBK");
        System.out.println("截取"+len+"個字符："+s);
      }
    } catch (UnsupportedEncodingException e) {
      e.printStackTrace();
    }

    return null;
  }
  /**
   * 思路：從第len個往前數(shù)，連續(xù)3的倍數(shù)個負數(shù)則全部輸出，其他情況則去掉最后count%3個輸出
   * @param str
   * @param len
   * @return
   */
  private static String StringCutByUTF8(String str,int len){
    byte[] bs = null;
    try {
      int count = 0;
      bs = str .getBytes("UTF-8");
      for(int i=len-1;i>=0;i--){
        if(bs[i]<0){
          count++;
        }else{
          break;
        }
      }  
      // 0  1  2  3  4  5  6 7 8 9  10 11 12
      //-60 -29 -70 -61 -80 -95 97 98 99 -76 -17 -72 -25 
      if(count%3==0){
        String s=new String(bs, 0, len, "UTF-8");
        System.out.println("截取"+len+"個字符："+s);
      }else{
        String s=new String(bs, 0, len-count%3, "UTF-8");
        System.out.println("截取"+len+"個字符："+s);
      }
    } catch (UnsupportedEncodingException e) {
      e.printStackTrace();
    }

    return null;
  }
  @Test
  public void TEST() {
    String str = "你好啊abc達哥";
    try {
      System.out.println("---測試gbk---");
      byte bs [] = str.getBytes("GBK");
      for(int i=0;i<=bs.length;i++){
        //System.out.print(bs[i]+" ");
        StringCutByGBK(str,i);

      }

      System.out.println("---測試UTF-8---");
      byte bs2 [] = str.getBytes("utf-8");
      for(int i=0;i<=bs2.length;i++){
        //System.out.print(bs[i]+" ");
        StringCutByUTF8(str,i);

      }
    } catch (UnsupportedEncodingException e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
    }

  }

}

如有疑問請留言或者到本站社區(qū)交流討論，感謝閱讀，希望能幫助到大家，謝謝大家對本站的支持！

您可能感興趣的文章:

Java使用JSONObject操作json實例解析
這篇文章主要介紹了Java使用JSONObject操作json,結合實例形式較為詳細的分析了Java使用JSONObject解析json數(shù)據(jù)相關原理、使用技巧與操作注意事項,需要的朋友可以參考下
2020-04-04
Java鉤子方法概念原理詳解
這篇文章主要介紹了Java鉤子方法概念原理詳解,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-02-02
解決idea2020.2遇到pom.xml文件報錯maven插件tomcat7的問題
這篇文章主要介紹了idea2020.2遇到pom.xml文件報錯maven插件tomcat7的問題,本文給大家分享解決方法，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-09-09
Java判斷一個時間是否在當前時間區(qū)間代碼示例
這篇文章主要給大家介紹了關于使用Java判斷一個時間是否在當前時間區(qū)間的相關資料,在日常開發(fā)中我們經(jīng)常會涉及到時間的大小比較或者是判斷某個時間是否在某個時間段內(nèi),需要的朋友可以參考下
2023-07-07
淺談JAVA在項目中如何自定義異常
今天給大家?guī)淼氖顷P于Java的相關知識,文章圍繞著JAVA在項目中如何自定義異常展開,文中有非常詳細的介紹及代碼示例,需要的朋友可以參考下
2021-06-06
Spring MVC 啟動過程源碼分析詳解
這篇文章主要介紹了Spring MVC 啟動過程源碼分析詳解,小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-07-07
Java高并發(fā)系統(tǒng)限流算法的實現(xiàn)
這篇文章主要介紹了Java高并發(fā)系統(tǒng)限流算法的應用,在開發(fā)高并發(fā)系統(tǒng)時有三把利器用來保護系統(tǒng)：緩存、降級和限流，限流可以認為服務降級的一種，限流是對系統(tǒng)的一種保護措施，需要的朋友可以參考下
2022-05-05
Java利用Map實現(xiàn)計算文本中字符個數(shù)
這篇文章主要為大家詳細介紹了Java如何利用Map集合實現(xiàn)計算文本中字符個數(shù)，文中的示例代碼講解詳細，感興趣的小伙伴可以跟隨小編一起學習一下
2022-08-08
java??常見位邏輯運算符梳理
這篇文章主要介紹了java常見位邏輯運算符梳理，文章圍繞主題展開詳細的內(nèi)容介紹，具有一定的參考價值，感興趣的小伙伴可以參一下下面文章詳細內(nèi)容
2022-08-08
eclipse報錯 eclipse啟動報錯解決方法
本文將介紹eclipse啟動報錯解決方法,需要了解的朋友可以參考下
2012-11-11