詳解KMP算法以及python如何實現(xiàn)
算法思路
Knuth-Morris-Pratt(KMP)算法是解決字符串匹配問題的經(jīng)典算法,下面通過一個例子來演示一下:
給定字符串"BBC ABCDAB ABCDABCDABDE",檢查里面是否包含另一個字符串"ABCDABD"。
1.從頭開始依次匹配字符,如果不匹配就跳到下一個字符


2.直到發(fā)現(xiàn)匹配字符,然后經(jīng)過一個內(nèi)循環(huán)嚴查字符串是否匹配

3.發(fā)現(xiàn)最后一個D不匹配,下面就該思考應(yīng)該把字符串向右移動多少個位置呢?傳統(tǒng)做法可能是移動一格,KMP算法就創(chuàng)新在這里。KMP算法通過查詢一個Partial Match Table(表內(nèi)存有字符串信息),然后計算出需要移動的步數(shù),這個表后面會介紹怎么來的。

這里我們看到D前面是B,查表得到第二個B對應(yīng)的是2,所以 移動數(shù) = 已匹配字符數(shù) - 查表所得數(shù) 也就是 6 - 2 = 4, 需要向右移動四格。

下面也是重復(fù)這個步驟

直到發(fā)現(xiàn)匹配或者字符長度超出(未發(fā)現(xiàn)匹配)。
Partial Match Table
那么這個查詢的表是怎么來的呢?仍然以"ABCDABD"為例

- "A"的前綴和后綴都為空集,共有元素的長度為0;
- "AB"的前綴為[A],后綴為[B],共有元素的長度為0;
- "ABC"的前綴為[A, AB],后綴為[BC, C],共有元素的長度0;
- "ABCD"的前綴為[A, AB, ABC],后綴為[BCD, CD, D],共有元素的長度為0;
- "ABCDA"的前綴為[A, AB, ABC, ABCD],后綴為[BCDA, CDA, DA, A],共有元素為"A",長度為1;
- "ABCDAB"的前綴為[A, AB, ABC, ABCD, ABCDA],后綴為[BCDAB, CDAB, DAB, AB, B],共有元素為"AB",長度為2;
- "ABCDABD"的前綴為[A, AB, ABC, ABCD, ABCDA, ABCDAB],后綴為[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的長度為0。
python實現(xiàn)
def partial_table(p):
'''''partial_table("ABCDABD") -> [0, 0, 0, 0, 1, 2, 0]'''
prefix = set()
res = [0]
for i in range(1, len(p)):
prefix.add(p[:i])
postfix = {p[j:i + 1] for j in range(1, i + 1)}
#print(p[:i+1],prefix,postfix,prefix & postfix or {''})
res.append(len((prefix & postfix or {''}).pop()))
return res
def kmp_match(s, p):
m = len(s);
n = len(p)
cur = 0 # 起始指針cur
table = partial_table(p)
while cur <= m - n: #只去匹配前m-n個
for i in range(n):
if s[i + cur] != p[i]:
cur += max(i - table[i - 1], 1) # 有了部分匹配表,我們不只是單純的1位1位往右移,可以一次移動多位
break
else:
return True # loop從 break 中退出時,else 部分不執(zhí)行。
return False
print partial_table1("ABCDABD")
print kmp_match("BBC ABCDAB ABCDABCDABDE", "ABCDABD")
以上就是詳解KMP算法以及python如何實現(xiàn)的詳細內(nèi)容,更多關(guān)于python實現(xiàn)KMP算法的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
利用Python中unittest實現(xiàn)簡單的單元測試實例詳解
如果項目復(fù)雜,進行單元測試是保證降低出錯率的好方法,Python提供的unittest可以很方便的實現(xiàn)單元測試,從而可以替換掉繁瑣雜亂的main函數(shù)測試的方法,將測試用例、測試方法進行統(tǒng)一的管理和維護。本文主要介紹了利用Python中unittest實現(xiàn)簡單的單元測試。2017-01-01
python networkx 根據(jù)圖的權(quán)重畫圖實現(xiàn)
這篇文章主要介紹了python networkx 根據(jù)圖的權(quán)重畫圖實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
利用PyWebIO庫10分鐘搭建一個漂亮的Python?Web應(yīng)用
這篇文章主要介紹了PyWebIO是一個用于在瀏覽器上獲取輸入和進行輸出的Python工具庫,它能讓我們零前端知識,純Python代碼構(gòu)建Web應(yīng)用,文中通過代碼介紹的非常詳細,需要的朋友可以參考下2025-01-01
Python編程使用matplotlib繪制動態(tài)圓錐曲線示例
這篇文章主要介紹了Python使用matplotlib繪制動態(tài)的圓錐曲線示例實現(xiàn)代碼,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步2021-10-10
Python函數(shù)遞歸調(diào)用實現(xiàn)原理實例解析
這篇文章主要介紹了Python函數(shù)遞歸調(diào)用實現(xiàn)原理過程解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-08-08

