淺談C++性能榨汁機(jī)之偽共享
前言
在多核并發(fā)編程中,如果將互斥鎖的爭(zhēng)用比作“性能殺手”的話,那么偽共享則相當(dāng)于“性能刺客”?!皻⑹帧迸c“刺客”的區(qū)別在于殺手是可見(jiàn)的,遇到殺手時(shí)我們可以選擇戰(zhàn)斗、逃跑、繞路、求饒等多種手段去應(yīng)付,但“刺客”卻不同,“刺客”永遠(yuǎn)隱藏在暗處,伺機(jī)給你致命一擊,防不勝防。具體到我們的并發(fā)編程中,遇到鎖爭(zhēng)用影響并發(fā)性能情況時(shí),我們可以采取多種措施(如縮短臨界區(qū),原子操作等等)去提高程序性能,但是偽共享卻是我們從所寫(xiě)代碼中看不出任何蛛絲馬跡的,發(fā)現(xiàn)不了問(wèn)題也就無(wú)法解決問(wèn)題,從而導(dǎo)致偽共享在“暗處”嚴(yán)重拖累程序的并發(fā)性能,但我們卻束手無(wú)策。
緩存行
為了進(jìn)行下面的討論,我們需要首先熟悉緩存行的概念,學(xué)過(guò)操作系統(tǒng)課程存儲(chǔ)結(jié)構(gòu)這部分內(nèi)容的同學(xué)應(yīng)該對(duì)存儲(chǔ)器層次結(jié)構(gòu)的金字塔模型印象深刻,金字塔從上往下代表存儲(chǔ)介質(zhì)的成本降低、容量變大,從下往上則代表存取速度的提高。位于金字塔模型最上層的是CPU中的寄存器,其次是CPU緩存(L1,L2,L3),再往下是內(nèi)存,最底層是磁盤(pán),操作系統(tǒng)采用這種存儲(chǔ)層次模型主要是為了解決CPU的高速與內(nèi)存磁盤(pán)低速之間的矛盾,CPU將最近使用的數(shù)據(jù)預(yù)先讀取到Cache中,下次再訪問(wèn)同樣數(shù)據(jù)的時(shí)候,可以直接從速度比較快的CPU緩存中讀取,避免從內(nèi)存或磁盤(pán)讀取拖慢整體速度。
CPU緩存的最小單位就是緩存行,緩存行大小依據(jù)架構(gòu)不同有不同大小,最常見(jiàn)的有64Byte和32Byte,CPU緩存從內(nèi)存取數(shù)據(jù)時(shí)以緩存行為單位進(jìn)行,每一次都取需要讀取數(shù)據(jù)所在的整個(gè)緩存行,即使相鄰的數(shù)據(jù)沒(méi)有被用到也會(huì)被緩存到CPU緩存中(這里又涉及到局部性原理,后面文章會(huì)進(jìn)行介紹)。
緩存一致性
在單核CPU情況下,上述方法可以正常工作,可以確保緩存到CPU緩存中的數(shù)據(jù)永遠(yuǎn)是“干凈”的,因?yàn)椴粫?huì)有其他CPU去更改內(nèi)存中的數(shù)據(jù),但是在多核CPU下,情況就變得更加復(fù)雜一些。多CPU中,每個(gè)CPU都有自己的私有緩存(可能共享L3緩存),當(dāng)一個(gè)CPU1對(duì)Cache中緩存數(shù)據(jù)進(jìn)行操作時(shí),如果CPU2在此之前更改了該數(shù)據(jù),則CPU1中的數(shù)據(jù)就不再是“干凈”的,即應(yīng)該是失效數(shù)據(jù),緩存一致性就是為了保證多CPU之間的緩存一致。
Linux系統(tǒng)中采用MESI協(xié)議處理緩存一致性,所謂MESI即是指CPU緩存的四種狀態(tài):
- M(修改,Modified):本地處理器已經(jīng)修改緩存行,即是臟行,它的內(nèi)容與內(nèi)存中的內(nèi)容不一樣,并且此 cache 只有本地一個(gè)拷貝(專有);
- E(專有,Exclusive):緩存行內(nèi)容和內(nèi)存中的一樣,而且其它處理器都沒(méi)有這行數(shù)據(jù);
- S(共享,Shared):緩存行內(nèi)容和內(nèi)存中的一樣, 有可能其它處理器也存在此緩存行的拷貝;
- I(無(wú)效,Invalid):緩存行失效, 不能使用。
每個(gè)CPU緩存行都在四個(gè)狀態(tài)之間互相轉(zhuǎn)換,以此決定CPU緩存是否失效,比如CPU1對(duì)一個(gè)緩存行執(zhí)行了寫(xiě)入操作,則此操作會(huì)導(dǎo)致其他CPU的該緩存行進(jìn)入Invalid無(wú)效狀態(tài),CPU需要使用該緩存行的時(shí)候需要從內(nèi)存中重新讀取。由此就解決了多CPU之間的緩存一致性問(wèn)題。
偽共享
何謂偽共享?上面我們提過(guò)CPU的緩存是以緩存行為單位進(jìn)行的,即除了本身所需讀寫(xiě)的數(shù)據(jù)之外還會(huì)緩存與該數(shù)據(jù)在同一緩存行的數(shù)據(jù),假設(shè)緩存行大小是32字節(jié),內(nèi)存中有“abcdefgh”八個(gè)int型數(shù)據(jù),當(dāng)CPU讀取“d”這個(gè)數(shù)據(jù)時(shí),CPU會(huì)將“abcdefgh”八個(gè)int數(shù)據(jù)組成一個(gè)緩存行加入到CPU緩存中。假設(shè)計(jì)算機(jī)有兩個(gè)CPU:CPU1和CPU2,CPU1只對(duì)“a”這個(gè)數(shù)據(jù)進(jìn)行頻繁讀寫(xiě),CPU2只對(duì)“b”這個(gè)數(shù)據(jù)進(jìn)行頻繁讀寫(xiě),按理說(shuō)這兩個(gè)CPU讀寫(xiě)數(shù)據(jù)沒(méi)有任何關(guān)聯(lián),也就不會(huì)產(chǎn)生任何競(jìng)爭(zhēng),不會(huì)有性能問(wèn)題,但是由于CPU緩存是以緩存行為單位進(jìn)行存取的,也是以緩存行為單位失效的,即使CPU1只更改了緩存行中“a”數(shù)據(jù),也會(huì)導(dǎo)致CPU2中該緩存行完全失效,同理,CPU2對(duì)“b”的改動(dòng)也會(huì)導(dǎo)致CPU1中該緩存行失效,由此引發(fā)了該緩存行在兩個(gè)CPU之間“乒乓”,緩存行頻繁失效,最終導(dǎo)致程序性能下降,這就是偽共享。
如何避免偽共享
避免偽共享主要有以下兩種方式:
1.緩存行填充(Padding):為了避免偽共享就需要將可能造成偽共享的多個(gè)變量處于不同的緩存行中,可以采用在變量后面填充字節(jié)的方式達(dá)到該目的。
2.使用某些語(yǔ)言或編譯器中強(qiáng)制變量對(duì)齊,將變量都對(duì)齊到緩存行大小,避免偽共享發(fā)生。
總結(jié)
一般偽共享都很隱蔽,很難被發(fā)現(xiàn),當(dāng)偽共享真正構(gòu)成性能瓶頸的時(shí)候,我們有必要去努力找到并解決它,但是在大部分對(duì)性能追求沒(méi)有那么高的應(yīng)用中,偽共享的存在對(duì)程序的危害很小,有時(shí)并不值得耗費(fèi)精力和額外的內(nèi)存空間(緩存行填充)去查找系統(tǒng)存在的偽共享。還是那句我一直以來(lái)遵循的話“不要過(guò)度優(yōu)化,不要提前優(yōu)化。”。
以上就是淺談C++性能榨汁機(jī)之偽共享的詳細(xì)內(nèi)容,更多關(guān)于C++性能榨汁機(jī)之偽共享的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
C++ 智能指針使用不當(dāng)導(dǎo)致內(nèi)存泄漏問(wèn)題解析
這篇文章主要介紹了C++ 智能指針使用不當(dāng)導(dǎo)致內(nèi)存泄漏問(wèn)題解析,本文通過(guò)代碼示例給大家介紹的非常詳細(xì),感興趣的朋友跟隨小編一起看看吧2024-07-07
C++實(shí)現(xiàn)數(shù)字轉(zhuǎn)換為十六進(jìn)制字符串的方法
這篇文章主要介紹了C++實(shí)現(xiàn)數(shù)字轉(zhuǎn)換為十六進(jìn)制字符串的方法,涉及C++操作數(shù)字與字符串轉(zhuǎn)換的相關(guān)技巧,需要的朋友可以參考下2015-06-06
C語(yǔ)言實(shí)現(xiàn)txt數(shù)據(jù)讀入內(nèi)存/CPU緩存實(shí)例詳解
這篇文章主要介紹了C語(yǔ)言實(shí)現(xiàn)txt數(shù)據(jù)讀入內(nèi)存/CPU緩存實(shí)例詳解的相關(guān)資料,這里對(duì)實(shí)現(xiàn)該函數(shù)進(jìn)行了代碼實(shí)現(xiàn),需要的朋友可以參考下2017-01-01
利用C語(yǔ)言玩轉(zhuǎn)魔方陣實(shí)例教程
這篇文章主要給大家介紹了關(guān)于利用C語(yǔ)言玩轉(zhuǎn)魔方陣的相關(guān)資料,文中詳細(xì)介紹了關(guān)于奇數(shù)魔方陣和4N 魔方陣的實(shí)現(xiàn)方法,通過(guò)示例代碼讓大家更好的參考學(xué)習(xí),需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧。2017-11-11
VC創(chuàng)建圓角dialog的實(shí)現(xiàn)方法
這篇文章主要介紹了VC創(chuàng)建圓角dialog的實(shí)現(xiàn)方法,結(jié)合實(shí)例形式分析了圓角dialog對(duì)話框的創(chuàng)建步驟與相關(guān)操作技巧,需要的朋友可以參考下2016-08-08
C++ Qt開(kāi)發(fā)之使用QProcess實(shí)現(xiàn)進(jìn)程管理
Qt 是一個(gè)跨平臺(tái)C++圖形界面開(kāi)發(fā)庫(kù),利用Qt可以快速開(kāi)發(fā)跨平臺(tái)窗體應(yīng)用程序,本文將重點(diǎn)介紹如何運(yùn)用QProcess組件實(shí)現(xiàn)針對(duì)進(jìn)程的控制管理等,感興趣的可以了解下2024-03-03

