Java?String源碼contains題解重復(fù)疊加字符串匹配
原題

解題思路
解題思路已經(jīng)寫(xiě)在代碼中了;
class Solution {
public:
bool contain(string &a, string &b, long long hash_b)
{
for (int i = 0; i <= a.size() - b.size(); i++)
{
int k = 0;
long long hash_a = 0;
while (k < b.size())
{
hash_a = (hash_a * 26 + a[i + k] - 'a') % INT32_MAX;
k++;
}
if (hash_b == hash_a)
return true;
}
return false;
}
int repeatedStringMatch(string a, string b)
{
// 1、統(tǒng)計(jì)a每個(gè)字符出現(xiàn)次數(shù)、b每個(gè)字符出現(xiàn)次數(shù),如果b有某字符而a沒(méi)有,返回-1
vector<int> rec_a(30, 0);
vector<int> rec_b(30, 0);
for (char c : a)
{
rec_a[c - 'a']++;
}
long long hash_b = 0;
int i = 0;
for (char c : b)
{
hash_b = (hash_b * 26 + c - 'a') % INT32_MAX;
rec_b[c - 'a']++;
}
for (int i = 0; i < 30; i++)
{
if (rec_b[i] > 0 && rec_a[i] == 0)
{
return -1;
}
}
// 2.1 本身b就是a的字串,用hash
if (a.size() >= b.size() && contain(a, b, hash_b))
{
return 1;
}
// 2.2 最大重疊不超過(guò)Bsize/Asize + 2
string aa = a;
for (int i = 2; i <= b.size() / a.size() + 2; i++)
{
aa += a;
if (aa.size() < b.size())
continue;
if (contain(aa, b, hash_b))
{
return i;
}
}
return -1;
}
};
但是C++畢竟沒(méi)有類似Java的contains函數(shù),所以檢查a字符串是否包含b就沒(méi)有那么方便,我這里自己實(shí)現(xiàn)的是利用hash來(lái)檢測(cè),其實(shí)可以優(yōu)化一下:
- 先計(jì)算前面b.size()個(gè)字符的hash值;
- 比較是否等于目標(biāo)hash值
- 如果不等于,
(當(dāng)前hash值-(當(dāng)前窗口首字符-'a')*26^k)*26 + 窗口右移新加進(jìn)來(lái)的字符-'a'; - 這樣只用完整的遍歷一遍 字符串a(chǎn) 就能夠知道它 有沒(méi)有包含 子串b,復(fù)雜度為 O(n);但是涉及到之前的取余操作,又要額外考慮下,當(dāng)前窗口的hash值是不是取過(guò)余;
- 而如果每次都一個(gè)個(gè)字符比,那么復(fù)雜度達(dá)到O(nm);
Java String contains 函數(shù)
于是對(duì) Java String 里面的 contains 函數(shù)很好奇,它內(nèi)部怎么實(shí)現(xiàn)的,就翻了下源碼,如下:

// String.contails(String s):
// 返回this字符串是否包含 子串s
public boolean contains(CharSequence s) {
return this.indexOf(s.toString()) >= 0;
}
// String.indexOf(String s)
// 返回this字符串中子串s的首字符索引
........
// 中間的幾個(gè)函數(shù)就省略了,都是一些特殊情況(比如this字符串的長(zhǎng)度小于s字符串的長(zhǎng)度,直接返回-1這種),
// 最后實(shí)現(xiàn)是在這個(gè)函數(shù)里
public static int indexOfLatin1Unsafe(byte[] src, int srcCount, byte[] tgt, int tgtCount, int fromIndex) {
assert fromIndex >= 0;
assert tgtCount > 0;
assert tgtCount <= tgt.length;
assert srcCount >= tgtCount;
// 目標(biāo)字符串的第一個(gè)字符
char first = (char)(tgt[0] & 255);
// 最多找max次
int max = srcCount - tgtCount;
// 從fromIndex處開(kāi)始找
for(int i = fromIndex; i <= max; ++i) {
// 如果該字符不等于first,接著i++,直到找到與first字符相等
if (getChar(src, i) != first) {
do {
++i;
} while(i <= max && getChar(src, i) != first);
}
if (i <= max) {
int j = i + 1;
int end = j + tgtCount - 1;
// 一個(gè)個(gè)字符逐個(gè)比較
for(int k = 1; j < end && getChar(src, j) == (tgt[k] & 255); ++k) {
++j;
}
// 如果j==end 說(shuō)明全部遍歷完都符合條件,返回首字符位置i
if (j == end) {
return i;
}
}
}
return -1;
}
可以看出 Java String 的 contains 方法 原理還是用的逐個(gè)字符比較,沒(méi)有用別的效果稍微高但很復(fù)雜的方法;
以上就是Java String源碼contains題解重復(fù)疊加字符串匹配的詳細(xì)內(nèi)容,更多關(guān)于Java String源碼contains的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
HashSet如何保證元素不重復(fù)(面試必問(wèn))
HashSet 不保證集合的迭代順序,但允許插入 null 值,也就是說(shuō)它可以將集合中的重復(fù)元素自動(dòng)過(guò)濾掉,保證存儲(chǔ)在 HashSet 中的元素都是唯一的,這篇文章主要介紹了HashSet如何保證元素不重復(fù)(面試必問(wèn)),需要的朋友可以參考下2021-12-12
詳解SpringBoot基礎(chǔ)之banner玩法解析
SpringBoot項(xiàng)目啟動(dòng)時(shí)會(huì)在控制臺(tái)打印一個(gè)默認(rèn)的啟動(dòng)圖案,這個(gè)圖案就是我們要講的banner,這篇文章主要介紹了SpringBoot基礎(chǔ)之banner玩法解析,感興趣的小伙伴們可以參考一下2019-04-04
Java面向?qū)ο蠡A(chǔ)知識(shí)之委托和lambda
這篇文章主要介紹了Java面向?qū)ο蟮闹泻?lambda,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)java基礎(chǔ)的小伙伴們有很好的幫助,需要的朋友可以參考下2021-11-11
Java?Springboot異步執(zhí)行事件監(jiān)聽(tīng)和處理實(shí)例
Java?SpringBoot中,監(jiān)聽(tīng)和處理事件是一種常見(jiàn)的模式,它允許不同的組件之間通過(guò)事件進(jìn)行通信,事件監(jiān)聽(tīng)和處理通常通過(guò)Spring的事件發(fā)布-訂閱模型來(lái)實(shí)現(xiàn),一個(gè)簡(jiǎn)單的Spring?Boot應(yīng)用程序示例,其中將包括事件的定義、事件的發(fā)布以及事件的監(jiān)聽(tīng)2024-07-07
Java線程池ThreadPoolExecutor的使用及其原理詳細(xì)解讀
這篇文章主要介紹了Java線程池ThreadPoolExecutor的使用及其原理詳細(xì)解讀,線程池是一種多線程處理形式,處理過(guò)程中將任務(wù)添加到隊(duì)列,然后在創(chuàng)建線程后自動(dòng)啟動(dòng)這些任務(wù),線程池線程都是后臺(tái)線程,需要的朋友可以參考下2023-12-12
解決HashMap多線程操作導(dǎo)致死循環(huán)問(wèn)題
文章主要講述了在多線程環(huán)境下,HashMap的并發(fā)操作可能導(dǎo)致的死循環(huán)問(wèn)題,包括鏈表/紅黑樹(shù)結(jié)構(gòu)破壞、擴(kuò)容過(guò)程中的混亂以及讀寫(xiě)不一致等,為了解決這些問(wèn)題,文章建議使用線程安全的ConcurrentHashMap替代HashMap,并介紹了其分段鎖機(jī)制和優(yōu)化方案2025-01-01
Spring?MVC各種參數(shù)進(jìn)行封裝的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于Spring?MVC各種參數(shù)進(jìn)行封裝的相關(guān)資料,SpringMVC內(nèi)置多種數(shù)據(jù)類型轉(zhuǎn)換器,可以根據(jù)請(qǐng)求中的參數(shù)與后端控制器方法的參數(shù)的關(guān)系為我們實(shí)現(xiàn)簡(jiǎn)單的數(shù)據(jù)封裝,需要的朋友可以參考下2023-06-06

