java短網(wǎng)址服務(wù)(TinyURL)生成算法
前不久做了一個優(yōu)惠劵的分享功能,其中一個功能就是生成一個優(yōu)惠劵分享短鏈接。生成的短鏈接要求每個鏈接都是唯一的,并且長度盡可能短。在網(wǎng)上查了一下相關(guān)的思路,發(fā)現(xiàn)了一個不錯的算法。這個算法的思路就是用[a-zA-Z0-9]建立一個長度為62的矩陣,然后把矩陣打亂,再生成一個全局唯一的數(shù)字,再把這個數(shù)字用矩陣內(nèi)的元素表示轉(zhuǎn)換成62進制,生成的鏈接長度最大才11位。所以短鏈接的生成關(guān)鍵點就變成了如何生成一個全局唯一的數(shù)字和實現(xiàn)進制的轉(zhuǎn)換。
1、生成全局唯一的數(shù)字
這本質(zhì)是一個分布式ID的問題。如果簡單處理的話可以借用redis的incr操作這樣每次取到的ID都是單調(diào)遞增且唯一的。另外一種方式是借用mysql,這里不是借用mysql的主鍵的auto_incr特性。而是每一臺應(yīng)用來請求時分配一個范圍比如 s1 [100-200], s2 來請求的時候就分配 [201-301],本質(zhì)是利用樂觀鎖進行一個cas操作。
如果不想借助外部去生成ID的話,可以用UUID算法。UUID長度12個字節(jié)組成由,以下幾個部分組成。
- 4個字節(jié)表示的Unix timestamp,
- 3個字節(jié)表示的機器的ID
- 2個字節(jié)表示的進程ID
- 3個字節(jié)表示的計數(shù)器
UUID是一類算法的統(tǒng)稱,具體有不同的實現(xiàn)。優(yōu)點是每臺機器可以獨立產(chǎn)生ID,理論上保證不會重復(fù),所以天然是分布式的,缺點是生成的ID太長,不僅占用內(nèi)存,而且索引查詢效率低。
還有一個叫Twitter Snowflake算法,本質(zhì)上看起來與UUID有些類似。

總的來說redis,mysql解決方案就比較簡單直接可以滿足大部分的場景,如果要保證高性能和高可用的話UUID和Twitter Snowflake算法就更合適,實現(xiàn)起來相對復(fù)雜一些。
2、進制轉(zhuǎn)換
這個操作就相對簡單了。直接上代碼:
/**
* 短鏈接生成
*/
public class TinyURL {
public static final char[] array =
{'0', '1', '2', '3', '4', '5', '6', '7', '8', '9',
'q', 'w', 'e', 'r', 't', 'y', 'u', 'i', 'o', 'p', 'a', 's', 'd',
'f', 'g', 'h', 'j', 'k', 'l', 'z', 'x', 'c', 'v', 'b', 'n', 'm',
'Q', 'W', 'E', 'R', 'T', 'Y', 'U', 'I', 'O', 'P', 'A', 'S', 'D',
'F', 'G', 'H', 'J', 'K', 'L', 'Z', 'X', 'C', 'V', 'B', 'N', 'M'};
public static Map<Character, Integer> charValueMap = new HashMap<Character, Integer>();
//初始化map
static {
for (int i = 0; i < array.length; i++) charValueMap.put(array[i], i);
}
public static void main(String[] args) {
for (int i = 0; i < 100; i++) {
long number = Long.MAX_VALUE - i;
String decimalStr = numberConvertToDecimal(number, 62);
System.out.println(number + " 轉(zhuǎn)換成 " + decimalStr);
long toNumber = decimalConvertToNumber(decimalStr, 62);
System.out.println(decimalStr + " 轉(zhuǎn)換成 " + toNumber);
}
}
/**
* 把數(shù)字轉(zhuǎn)換成相對應(yīng)的進制,目前支持(2-62)進制
*
* @param number
* @param decimal
* @return
*/
public static String numberConvertToDecimal(long number, int decimal) {
StringBuilder builder = new StringBuilder();
while (number != 0) {
builder.append(array[(int) (number - (number / decimal) * decimal)]);
number /= decimal;
}
return builder.reverse().toString();
}
/**
* 把進制字符串轉(zhuǎn)換成相應(yīng)的數(shù)字
* @param decimalStr
* @param decimal
* @return
*/
public static long decimalConvertToNumber(String decimalStr, int decimal) {
long sum = 0;
long multiple = 1;
char[] chars = decimalStr.toCharArray();
for (int i = chars.length - 1; i >= 0; i--) {
char c = chars[i];
sum += charValueMap.get(c) * multiple;
multiple *= decimal;
}
return sum;
}
}
這里面有個小優(yōu)化就是用charValueMap記錄每個字符對應(yīng)的數(shù)值,這是一個用空間換時間的策略優(yōu)化,把O(n)的時間降為O(1)。
另外通常我們要記錄短網(wǎng)址與長網(wǎng)址的對應(yīng)的關(guān)系,相對于直接存儲短網(wǎng)址的而言,存儲對應(yīng)的數(shù)值ID會更省空間。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
使用Java的方式模擬Flutter的Widget實現(xiàn)多層括號嵌套
這篇文章主要介紹了使用Java的方式模擬Flutter的Widget的實現(xiàn)多層括號嵌套問題,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價值,需要的朋友可以參考下2019-07-07
hashMap擴容時應(yīng)該注意這些死循環(huán)問題
今天給大家?guī)淼氖顷P(guān)于Java的相關(guān)知識,文章圍繞著hashMap擴容時的死循環(huán)問題展開,文中有非常詳細(xì)的介紹及代碼示例,需要的朋友可以參考下2021-06-06
SpringMVC學(xué)習(xí)之JSON和全局異常處理詳解
在項目上線之后,往往會出現(xiàn)一些不可預(yù)料的異常信息,對于邏輯性或設(shè)計性問題,開發(fā)人員或者維護人員需要通過日志,查看異常信息并排除異常,這篇文章主要給大家介紹了關(guān)于SpringMVC學(xué)習(xí)之JSON和全局異常處理的相關(guān)資料,需要的朋友可以參考下2022-10-10
如何在spring boot中進行參數(shù)校驗示例詳解
這篇文章主要介紹了如何在spring-boot中進行參數(shù)校驗及l(fā)ombok的使用詳解,本文通過實例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-05-05

