C語(yǔ)言kmp算法簡(jiǎn)單示例和實(shí)現(xiàn)原理探究
以前看過(guò)kmp算法,當(dāng)時(shí)接觸后總感覺(jué)好深?yuàn)W啊,抱著數(shù)據(jù)結(jié)構(gòu)的數(shù)啃了一中午,最終才大致看懂,后來(lái)提起kmp也只剩下“奧,它是做模式匹配的”這點(diǎn)干貨。最近有空,翻出來(lái)算法導(dǎo)論看看,原來(lái)就是這么簡(jiǎn)單(下不說(shuō)程序?qū)崿F(xiàn),思想很簡(jiǎn)單)。
模式匹配的經(jīng)典應(yīng)用:從一個(gè)字符串中找到模式字串的位置。如“abcdef”中“cde”出現(xiàn)在原串第三個(gè)位置。從基礎(chǔ)看起
樸素的模式匹配算法
A:abcdefg B:cde
首先B從A的第一位開(kāi)始比較,B++==A++,如果全部成立,返回即可;如果不成立,跳出,從A的第二位開(kāi)始比較,以此類推。
/*
*侯凱,2014-9-16
*功能:模式匹配
*/
#include<iostream>
#include <string>
using namespace std;
int index(char *a,char *b)
{
int tarindex = 0;
while(a[tarindex]!='\0')
{
int tarlen = tarindex;
int patlen;
for(patlen=0;b[patlen]!='\0';patlen++)
{
if(a[tarlen++]!=b[patlen])
{
break;
}
}
if(b[patlen]=='\0')
{
return tarindex;
}
tarindex++;
}
return -1;
}
int main()
{
char *a = "abcdef";
char *b = "cdf";
cout<<index(a,b)<<endl;
system("Pause");
}
思路樸實(shí)無(wú)華,十分有效,但是時(shí)間復(fù)雜度是O(mn),m、n分別是字符串和模式串的長(zhǎng)度。模式匹配是一個(gè)常見(jiàn)的應(yīng)用問(wèn)題,用的廣了,就有人想法去優(yōu)化了。Rabin-Karp算法、有限自動(dòng)機(jī)等等,前仆后繼,最終出現(xiàn)了KMP(Knuth-Morris-Pratt)算法。
kmp算法

優(yōu)化的地方:如果我們知道模式中a和后面的是不相等的,那么第一次比較后,發(fā)現(xiàn)后面的的4個(gè)字符均對(duì)應(yīng)相等,可見(jiàn)a下次匹配的位置可以直接定位到f了。說(shuō)明主串對(duì)應(yīng)位置i的回溯是不必要的。這是kmp最基本最關(guān)鍵的思想和目標(biāo)。
再比如:

由于abc 與后面的abc相等,可以直接得到紅色的部分。而且根據(jù)前一次比較的結(jié)果,abc就不需要比較了,現(xiàn)在只需從f-a處開(kāi)始比較即可。說(shuō)明主串對(duì)應(yīng)位置i的回溯是不必要的。要變化的是模式串中j的位置(j不一定是從1開(kāi)始的,比如第二個(gè)例子)
j的變化取決于模式串的前后綴的相似度,例2中abc和abc(靠近x的),前綴為abc,j=4開(kāi)始執(zhí)行。
j是前一次執(zhí)行的模式子串(前幾個(gè),上例為6)中前綴的個(gè)數(shù)+1;它與模式字串中從前向后的前綴和從后向前的后綴的相同子串是有關(guān)系的,因?yàn)橄麓芜@部分相同的前綴就會(huì)移動(dòng)到這部分后綴的位置,因?yàn)槿绻苿?dòng)到后綴的前面位置,看圖:

所以如果這次是j,下次的位置應(yīng)該就是j前面的子串的最大前綴的長(zhǎng)度+1,用這個(gè)新的位置再和原字符串的i位置進(jìn)行比較就很幸福了。
這次是j,下次到底是多少呢,這就涉及到怎么計(jì)算的問(wèn)題了?其實(shí)只看模式串我們就可以構(gòu)建出這個(gè)j->x的關(guān)系,關(guān)系稱為前綴函數(shù),結(jié)果存儲(chǔ)在數(shù)組中,稱為前綴數(shù)組。
偽代碼:
compiter-prefix-function(P)
m<-length[p]
pi[1]<-0
k<-0
for q<-2 to m
do while k>0 and P[k+1]!=P[q]
do k<-pi[k] //前綴的前綴...
if P[k+1]==P[q]
then k<-k+1
pi[q]<-k
return pi
使用前綴數(shù)組可很快地實(shí)現(xiàn)模式匹配,程序匹配字符串中模式出現(xiàn)的所有位置。
kmp-matcher(T, P)
n<-length[T]
m<-length[P]
pi<-compiter-prefix-function(P)
q<-0
for i<-1 to n
do while q>0 and P[q+1]!=T[i]
do q<-pi[q] //前綴的前綴...
if P[q+1]==T[i]
then q<-q+1
if q==m
then print “Pattern occurs with shift”i-m
q<-pi[q]
這兩段代碼思想完全相同,如果和前綴不同就比較前綴的前綴…,比較巧妙。如果kmp有難理解的地方,估計(jì)就是這段偽碼的了。
KMP算法的時(shí)間復(fù)雜度為O(n+m)。
這里需要強(qiáng)調(diào)一下,KMP算法的僅當(dāng)模式與主串之間存在很多部分匹配情況下才能體現(xiàn)它的優(yōu)勢(shì),部分匹配時(shí)KMP的i不需要回溯,否則和樸素模式匹配沒(méi)有什么差別。
相關(guān)文章
VC使用TerminateProcess結(jié)束進(jìn)程實(shí)例
這篇文章主要介紹了VC使用TerminateProcess結(jié)束進(jìn)程的方法,實(shí)例演示了TerminateProcess結(jié)束進(jìn)程的具體實(shí)現(xiàn)過(guò)程,在進(jìn)行VC應(yīng)用程序開(kāi)發(fā)時(shí)非常具有實(shí)用價(jià)值,需要的朋友可以參考下2014-10-10
C++日期與時(shí)間 chrono庫(kù)介紹及使用教程
chrono庫(kù)是C++11中的一個(gè)標(biāo)準(zhǔn)庫(kù),它提供了一系列與時(shí)間相關(guān)的類和函數(shù),用于表示和處理時(shí)間間隔,時(shí)鐘和時(shí)間點(diǎn),C++20新增Calendar,這篇文章主要介紹了C++日期與時(shí)間 chrono庫(kù)介紹及使用,需要的朋友可以參考下2023-12-12
關(guān)于AVLTree(C++實(shí)現(xiàn))沒(méi)有統(tǒng)一旋轉(zhuǎn)操作的問(wèn)題
這篇文章主要介紹了關(guān)于AVLTree(C++實(shí)現(xiàn))沒(méi)有統(tǒng)一旋轉(zhuǎn)操作的問(wèn)題,本文給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-02-02
C語(yǔ)言驅(qū)動(dòng)開(kāi)發(fā)之內(nèi)核文件的讀寫(xiě)
這篇文章主要為大家詳細(xì)介紹了C語(yǔ)言驅(qū)動(dòng)開(kāi)發(fā)中內(nèi)核文件的讀寫(xiě)的系列函數(shù),文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)一下2023-06-06
先序遍歷二叉樹(shù)的遞歸實(shí)現(xiàn)與非遞歸實(shí)現(xiàn)深入解析
以下是對(duì)先序遍歷二叉樹(shù)的遞歸實(shí)現(xiàn)與非遞歸實(shí)現(xiàn)進(jìn)行了詳細(xì)的分析介紹,需要的朋友可以過(guò)來(lái)參考下2013-07-07
C++實(shí)現(xiàn)歸并排序(MergeSort)
這篇文章主要為大家詳細(xì)介紹了C++實(shí)現(xiàn)歸并排序,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-04-04
C語(yǔ)言中函數(shù)棧幀的創(chuàng)建和銷毀的深層分析
在C語(yǔ)言中,每一個(gè)正在運(yùn)行的函數(shù)都有一個(gè)棧幀與其對(duì)應(yīng),棧幀中存儲(chǔ)的是該函數(shù)的返回地址和局部變量。從邏輯上講,棧幀就是一個(gè)函數(shù)執(zhí)行的環(huán)境:函數(shù)參數(shù)、函數(shù)的局部變量、函數(shù)執(zhí)行完后返回到哪里等等2022-04-04
C++的template模板中class與typename關(guān)鍵字的區(qū)別分析
這篇文章中我們來(lái)談一談C++的template模板中class與typename關(guān)鍵字的區(qū)別分析,同時(shí)會(huì)講到嵌套從屬名稱時(shí)的一些注意點(diǎn),需要的朋友可以參考下2016-06-06
C++ Custom Control控件向父窗體發(fā)送對(duì)應(yīng)的消息
這篇文章主要介紹了C++ Custom Control控件向父窗體發(fā)送對(duì)應(yīng)的消息的相關(guān)資料,需要的朋友可以參考下2015-06-06

