C++使用數(shù)組來實(shí)現(xiàn)哈夫曼樹
寫在前面
哈夫曼樹又稱最優(yōu)二叉樹,是一種帶權(quán)路徑長(zhǎng)度最短的二叉樹。所謂樹的帶權(quán)路徑長(zhǎng)度,就是樹中所有的葉結(jié)點(diǎn)的權(quán)值乘上其到根結(jié)點(diǎn)的路徑長(zhǎng)度(若根結(jié)點(diǎn)為0層,葉結(jié)點(diǎn)到根結(jié)點(diǎn)的路徑長(zhǎng)度為葉結(jié)點(diǎn)的層數(shù))。樹的路徑長(zhǎng)度是從樹根到每一結(jié)點(diǎn)的路徑長(zhǎng)度之和,記為WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln),N個(gè)權(quán)值Wi(i=1,2,...n)構(gòu)成一棵有N個(gè)葉結(jié)點(diǎn)的二叉樹,相應(yīng)的葉結(jié)點(diǎn)的路徑長(zhǎng)度為L(zhǎng)i(i=1,2,...n)。可以證明霍夫曼樹的WPL是最小的;但是今天,咱們不談哈夫曼編碼,就只用結(jié)構(gòu)體配合數(shù)組來完成哈夫曼樹的生成,目標(biāo)是得到正確的所有權(quán)值的和。
構(gòu)造思想
以字符的使用頻率做權(quán)構(gòu)建一棵哈夫曼樹,然后利用哈夫曼樹對(duì)字符進(jìn)行編碼,俗稱哈夫曼編碼。具體來講,是將所要編碼的字符作為葉子結(jié)點(diǎn),該字符在文件中的使用頻率作為葉子結(jié)點(diǎn)的權(quán)值,以自底向上的方式、通過執(zhí)行n-1次的“合并”運(yùn)算后構(gòu)造出最終所要求的樹,即哈夫曼樹,它的核心思想是讓權(quán)值大的葉子離根最近。每次從樹的集合中取出雙親為0且權(quán)值最小的兩棵樹作為左、右子樹,構(gòu)造一棵新樹,新樹根結(jié)點(diǎn)的權(quán)值為其左右孩子結(jié)點(diǎn)權(quán)之和,將新樹插入到樹的集合中。
算法設(shè)計(jì)
步驟1:確定合適的數(shù)據(jù)結(jié)構(gòu)。
步驟2:初始化。構(gòu)造n棵結(jié)點(diǎn)為n個(gè)字符的單結(jié)點(diǎn)樹集合F={T1,T2,…, Tn},每棵樹中只有一個(gè)帶權(quán)的根結(jié)點(diǎn),權(quán)值為該字符的使用頻率;
步驟3:如果F中只剩下一棵樹,則哈夫曼樹構(gòu)造成功,轉(zhuǎn)步驟6;否則,從集合F中取出雙親為0且權(quán)值最小的兩棵樹Ti和Tj,將它們合并成一棵新樹Zk,新樹以Ti為左兒子, Tj為右兒子(反之也可以)。新樹Zk的根結(jié)點(diǎn)的權(quán)值為Ti與Tj的權(quán)值之和;
步驟4:從集合F中刪去Ti、Tj,加入Zk;
步驟5:重復(fù)步驟3和4;
步驟6:從葉子結(jié)點(diǎn)到根結(jié)點(diǎn)逆向求出每個(gè)字符的哈夫曼編碼(約定左分支表示字符“0”,右分支表示字符“1”)。則從根結(jié)點(diǎn)到葉子結(jié)點(diǎn)路徑上的分支字符組成的字符串即為葉子字符的哈夫曼編碼。算法結(jié)束。
構(gòu)造實(shí)例
已知某系統(tǒng)在通信聯(lián)絡(luò)中只可能出現(xiàn)8種字符,分別為a,b,c,d,e,f,g,h,其使用頻率分別為0.05,0.29,0.07,0.08,0.14,0.23,0.03,0.11,試設(shè)計(jì)哈夫曼編碼。設(shè)權(quán)w=(5,29,7,8,14,23,3,11),n=8,按哈夫曼算法的設(shè)計(jì)步驟構(gòu)造一棵哈夫曼編碼樹,具體過程如下:


理解代碼
源碼:
#include <iostream>
using namespace std;
#define N 8
struct Node
{
char L;//字母
int K;//權(quán)值
bool IsRoot;//是否為根結(jié)點(diǎn)
int Lc, Rc;//左右子樹
Node(char l = '/0', int k = 0, bool isRoot = false) {
L = l; K = k; IsRoot = isRoot; Lc = Rc = -1;
}
};
Node A[N + N - 1] = { Node('a',5,true) , Node('b',29,true), Node('c',7,true), Node('d',8,true),
Node('e',14,true), Node('f',23,true), Node('g',3,true), Node('h',11,true) };
void FindMin(Node A[], int &min1, int &min2,int num)
{
min1 = num - 1;
for (int i = 0; i < num; i++) {
if (A[i].IsRoot && A[i].K < A[min1].K) min1 = i;
}
min2 = num - 1;
for (int i = 0; i < num; i++) {
if (min1 != i && A[i].IsRoot &&A[i].K < A[min2].K) min2 = i;
}
}
int main()
{
int y = 1, num = N;
int min1=0, min2=0;
for (int i = 0; i < N; i++) {
FindMin(A,min1,min2,num);
A[num].K = A[min1].K + A[min2].K;
A[num].Lc = min1;
A[num].Rc = min2;
A[num].IsRoot = true;
A[min1].IsRoot = false;
A[min2].IsRoot = false;
A[num].L = 'h' + y;
y++; num++;
}
cout << "最終權(quán)值為:" << A[14].K << endl;
}確定結(jié)構(gòu)體
首先我們創(chuàng)建結(jié)點(diǎn) Node 結(jié)構(gòu)體,并給他定義了五個(gè)屬性,分別是字符、權(quán)值、布爾型根結(jié)點(diǎn)標(biāo)志、以及左右子樹。隨后直接定義Node類型數(shù)組Node(char l,int k,bool isRoot),初始化Node A數(shù)組的長(zhǎng)度為 N+N-1的原因是:選取兩個(gè)最小權(quán)值生成新的結(jié)點(diǎn),并把結(jié)點(diǎn)放入A數(shù)組中,相當(dāng)于每?jī)蓚€(gè)結(jié)點(diǎn)會(huì)多生成一個(gè)節(jié)點(diǎn),那么n個(gè)結(jié)點(diǎn)就會(huì)生成n-1個(gè)結(jié)點(diǎn),總數(shù)就是n+n-1;我們依次把八個(gè)結(jié)點(diǎn)放入數(shù)組中,并把IsRoot置為true,初始結(jié)點(diǎn)均沒有參加生成新節(jié)點(diǎn),都是根結(jié)點(diǎn)。
循環(huán)找出最小值
將A傳入找最小值的函數(shù),初始num為N,隨著新節(jié)點(diǎn)的生成,逐漸++,然后默認(rèn)最小值為數(shù)組的最后一個(gè)元素,利用一重for循環(huán)遍歷出最小值和次小值,這里注意,找出的最小值必須是根結(jié)點(diǎn)才可以,參加過生成新結(jié)點(diǎn)的都要把IsRoot設(shè)為false,次小值就是在不等于最小值的情況下找出最小值。
調(diào)用細(xì)節(jié)
主函數(shù)中利用一重for循環(huán)調(diào)用FindMin函數(shù)找出兩個(gè)最小權(quán)值結(jié)點(diǎn)并默認(rèn)放到數(shù)組的num位置上,即為最后一個(gè)位置;首先新節(jié)點(diǎn)的權(quán)值由兩個(gè)最小權(quán)值相加,并把新節(jié)點(diǎn)的左右子樹設(shè)為找到的兩個(gè)最小權(quán)值結(jié)點(diǎn),由于結(jié)構(gòu)體數(shù)組默認(rèn)IsRoot為false,所有要把新節(jié)點(diǎn)設(shè)為根結(jié)點(diǎn),而把用過的結(jié)點(diǎn)取消根結(jié)點(diǎn)身份,L用來更換結(jié)點(diǎn)的字符,最后num++,y++都很好理解,經(jīng)過七次新節(jié)點(diǎn)的生成,我們不難猜到A[14]的權(quán)值k為100;

調(diào)試試圖

通過調(diào)試界面可以看到第一個(gè)生成的A[8]結(jié)點(diǎn)的左右子樹是A[0]和A[6],而且權(quán)值正好是他們兩個(gè)結(jié)點(diǎn)的權(quán)相加;

A[9]的k是新的兩個(gè)最小根結(jié)點(diǎn)A[2]和A[8]組成的,可以確認(rèn)權(quán)值沒有問題,A[8]能參加新節(jié)點(diǎn)的合成說明我們成功的把他設(shè)置為了根結(jié)點(diǎn),然后直接看最后一個(gè)結(jié)點(diǎn)的信息;

權(quán)值正確為100,是根節(jié)點(diǎn),因?yàn)橹挥幸粋€(gè)根結(jié)點(diǎn),沒法繼續(xù)合成新節(jié)點(diǎn),程序結(jié)束。
總結(jié)
哈夫曼在算法和數(shù)據(jù)結(jié)構(gòu)中都挺重要的,只是不同場(chǎng)景下實(shí)現(xiàn)的方法和形式會(huì)有所不同,但就算千變?nèi)f化也離不開最基礎(chǔ)的“二合一”形式,我提出的這個(gè)哈夫曼是不難理解的,希望對(duì)大家有所幫助,共同進(jìn)步?。?!
到此這篇關(guān)于C++使用數(shù)組來實(shí)現(xiàn)哈夫曼樹的文章就介紹到這了,更多相關(guān)C++哈夫曼樹內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
C語言控制臺(tái)實(shí)現(xiàn)打飛機(jī)小游戲
這篇文章主要為大家詳細(xì)介紹了C語言控制臺(tái)實(shí)現(xiàn)打飛機(jī)小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-04-04
Qt?自定義屬性Q_PROPERTY不顯示float類型的解決
這篇文章主要介紹了Qt?自定義屬性Q_PROPERTY不顯示float類型的問題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-11-11
C/C++讀寫注冊(cè)表中二進(jìn)制數(shù)據(jù)(代碼示例)
這篇文章主要介紹了使用Windows API 函數(shù)中的RegOpenKeyEx()函數(shù)和RegSetValueEx()函數(shù)來實(shí)現(xiàn)對(duì)注冊(cè)表某項(xiàng)寫入二進(jìn)制鍵值,需要的朋友可以參考下2020-02-02
C語言中經(jīng)socket接收數(shù)據(jù)的相關(guān)函數(shù)詳解
這篇文章主要介紹了C語言中經(jīng)socket接收數(shù)據(jù)的相關(guān)函數(shù)詳解,分別為recv()函數(shù)和recvfrom()函數(shù)以及recvmsg()函數(shù)的使用,需要的朋友可以參考下2015-09-09
C++實(shí)現(xiàn)多源最短路徑之Floyd算法示例
這篇文章主要介紹了C++實(shí)現(xiàn)多源最短路徑之Floyd算法,結(jié)合實(shí)例形式分析了多源最短路徑之Floyd算法的原理、實(shí)現(xiàn)方法及核心代碼,需要的朋友可以參考下2017-08-08
C++中對(duì)C語言結(jié)構(gòu)體用法的擴(kuò)充
今天小編就為大家分享一篇關(guān)于C++中對(duì)C語言結(jié)構(gòu)體用法的擴(kuò)充,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2018-12-12
詳解C語言中的wait()函數(shù)和waitpid()函數(shù)
這篇文章主要介紹了C語言中的wait()函數(shù)和waitpid()函數(shù),注意其在中斷進(jìn)程方面用法的不同,需要的朋友可以參考下2015-08-08
strings命令分析淺談Go和C++編譯時(shí)的一點(diǎn)小區(qū)別
今天小編就為大家分享一篇關(guān)于strings命令分析淺談Go和C++編譯時(shí)的一點(diǎn)小區(qū)別,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧2019-04-04

