C++中的數(shù)據(jù)對(duì)齊示例詳解
前言
對(duì)于C/C++程序員來(lái)說(shuō),掌握數(shù)據(jù)對(duì)齊是很有必要的,因?yàn)橹挥辛私饬诉@個(gè)概念,才能知道編譯器在什么時(shí)候會(huì)偷偷的塞入一些字節(jié)(padding)到我們的結(jié)構(gòu)體(struct/class),也唯有這樣我們才能更好的理解、優(yōu)化結(jié)構(gòu)體和內(nèi)存。
幾個(gè)栗子
看看幾個(gè)簡(jiǎn)單的Struct,能猜出他們的SIZE嗎?(運(yùn)行于64Bit win10 vs2017)
struct A
{
char c1;
};
struct B
{
int i1;
};
struct C
{
char c1;
int i1;
};
struct D
{
char c1;
int i1;
char c2;
};
struct E
{
char c1;
char c2;
int i1;
};
int main()
{
std::cout << "A's size is " << sizeof(A) << std::endl;
std::cout << "B's size is " << sizeof(B) << std::endl;
std::cout << "C's size is " << sizeof(C) << std::endl;
std::cout << "D's size is " << sizeof(D) << std::endl;
std::cout << "E's size is " << sizeof(E) << std::endl;
}
先揭曉答案

如果對(duì)任何一個(gè)結(jié)構(gòu)體的大小有疑問(wèn),那么這篇文章非常適合你,請(qǐng)接著往下看,我們會(huì)解釋數(shù)據(jù)對(duì)齊。
數(shù)據(jù)對(duì)齊
處理器讀取數(shù)據(jù)的行為
在C/C++中,每種數(shù)據(jù)類(lèi)型都有對(duì)齊的要求(這個(gè)更多是處理器的要求而非語(yǔ)言層面),大家都知道,處理器工作的時(shí)候需要數(shù)據(jù)總線(data bus)、控制總線(control bus)和地址總線(address bus)一起配合工作。而在數(shù)據(jù)總線取數(shù)據(jù)的時(shí)候,處理器為了高效的工作,一次會(huì)取4byte或者8byte數(shù)據(jù)(依系統(tǒng)32bit或者64bit而不同),這就是所謂數(shù)據(jù)字長(zhǎng)(word size)。同時(shí)在讀取內(nèi)存的時(shí)候,也會(huì)從4byte或者8byte邊界開(kāi)始讀取,這是處理器行為,我們只能尊重不能改變。考慮下面的例子,
struct F
{
int i1
char c1;
int i2;
char c2;
};
#include <iostream>
int main()
{
F f;
printf("0x%p\n", &f);
}
它的起始地址輸出是:
0x000000FE8BCFFB88
所以在內(nèi)存中可能的排列就是:

讀取數(shù)據(jù)的時(shí)候,每次讀入8btye,8個(gè)字節(jié)為一個(gè)讀取單元,就像蒸籠的一格,這樣做的好處是每次可以盡可能多的讀入數(shù)據(jù),減少讀取次數(shù)。設(shè)想,如果一次只讀入一個(gè)字節(jié)數(shù)據(jù),那么一個(gè)Int就需要4次讀取,明顯效率就很低。
編譯器的做法
如果沒(méi)有對(duì)齊
了解了處理器如何讀取數(shù)據(jù)的,我們就不難理解編譯器為什么會(huì)做出調(diào)整。試想,如果編譯器不在后臺(tái)做出填充(padding),那么我們就會(huì)遇到這種情況

像這樣的話,訪問(wèn)i1, c1 都不會(huì)有問(wèn)題,但是訪問(wèn)i2就會(huì)發(fā)現(xiàn),數(shù)據(jù)散落在不同的蒸籠,原本只需要一次讀取就行的數(shù)據(jù),還需要一次額外的數(shù)據(jù)讀取才行,這就造成了讀取數(shù)據(jù)的低效,在某些嚴(yán)格的CPU,比如ARM上面,這種非對(duì)齊的數(shù)據(jù)讀操作甚至?xí)痪芙^。
編譯器對(duì)齊
所以,為了讓數(shù)據(jù)讀取效率最大化,編譯器會(huì)選擇犧牲一部分空間來(lái)?yè)Q取效率,他們不會(huì)允許i2橫跨兩個(gè)讀取單元。在實(shí)際中,上面的結(jié)構(gòu)體會(huì)是這樣的

可以看出,
- 為了解決i2的對(duì)齊問(wèn)題,c1之后填充了3個(gè)空字節(jié)
- 同時(shí)為了保持整個(gè)結(jié)構(gòu)體的對(duì)齊(結(jié)構(gòu)體對(duì)齊字節(jié)數(shù)等于其最大的數(shù)據(jù)成員的對(duì)齊字節(jié)數(shù),這里是4),在結(jié)構(gòu)體的尾部還會(huì)有3個(gè)空字節(jié)
- 整個(gè)結(jié)構(gòu)體的大小就是16字節(jié),有6個(gè)字節(jié)是空字節(jié)。
所以,在編譯器的作用下,最開(kāi)始幾個(gè)Struct實(shí)際上擴(kuò)展為,
struct A
{
char c1; //no padding
};
struct B
{
int i1; //no padding
};
struct C
{
char c1;
char pad[3]; //padding
int i1;
};
struct D
{
char c1;
char pad1[3]; //padding
int i1;
char c2;
char pad2[3]; //padding
};
struct E
{
char c1;
char c2;
char pad[2]; //padding
int i1;
};
對(duì)齊的目的是要讓數(shù)據(jù)訪問(wèn)更高效,一般來(lái)說(shuō),數(shù)據(jù)類(lèi)型的對(duì)齊要求和它的長(zhǎng)度是一致的,比如,
- char 是 1
- short 是 2
- int 是 4
- double 是 8
這不是巧合,比如short,2對(duì)齊保證了short只可能出現(xiàn)在一個(gè)讀取單元的0, 2, 4, 6格,而不會(huì)出現(xiàn)在1, 3, 5, 7格;再比如int,4對(duì)齊保證了一個(gè)讀取單元可以裝載2個(gè)int——在0或者4格。從根本上杜絕了同一個(gè)數(shù)據(jù)橫跨讀取單元的問(wèn)題。
總結(jié)
可能有人會(huì)疑惑了,知道這些對(duì)我們工作有什么幫助嗎?如果僅僅是比較High-Level的應(yīng)用程序編程,可能確實(shí)感覺(jué)不明顯,最多就當(dāng)成一個(gè)知識(shí)點(diǎn)了解一下,但是對(duì)于搞比較底層開(kāi)發(fā)的,比如游戲引擎,或者是在內(nèi)存環(huán)境很緊張的情況下開(kāi)發(fā),比如嵌入式開(kāi)發(fā),那了解這個(gè)有助于在某些情況下節(jié)約內(nèi)存。
考慮前面的D和E結(jié)構(gòu)體,他們擁有完全一樣的成員,卻有著不同的結(jié)構(gòu)體大小,就是因?yàn)镋選擇把對(duì)齊要求接近的變量類(lèi)型放在一起,減小了填充padding的數(shù)量從而達(dá)到了減小結(jié)構(gòu)體大小的目的。
在設(shè)計(jì)結(jié)構(gòu)體的時(shí)候,這個(gè)可以作為一個(gè)考量,有一些函數(shù)可以幫助我們查看某個(gè)類(lèi)型的對(duì)齊要求,比如Visual Studio中的__alignof函數(shù)。
這就是關(guān)于數(shù)據(jù)對(duì)齊的一些基礎(chǔ)知識(shí),希望能幫助大家解惑,如果您發(fā)現(xiàn)本文有任何寫(xiě)的不對(duì)的地方,歡迎留言指出來(lái);如果有其他問(wèn)題,也歡迎留言一起討論。
到此這篇關(guān)于C++中的數(shù)據(jù)對(duì)齊的文章就介紹到這了,更多相關(guān)C++數(shù)據(jù)對(duì)齊內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
使用remalloc的注意事項(xiàng)說(shuō)明(必看篇)
下面小編就為大家?guī)?lái)一篇使用remalloc的注意事項(xiàng)說(shuō)明(必看篇)。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-03-03
詳解C語(yǔ)言整數(shù)和浮點(diǎn)數(shù)在內(nèi)存中的存儲(chǔ)
這篇文章主要介紹了C語(yǔ)言整數(shù)和浮點(diǎn)數(shù)在內(nèi)存中是如何存儲(chǔ)的,文中有詳細(xì)的代碼示例供大家參考,對(duì)大家了解學(xué)習(xí)C語(yǔ)言整數(shù)和浮點(diǎn)數(shù)在內(nèi)存中的存儲(chǔ)有一定的幫助,需要的朋友可以參考下2024-03-03
一文帶你學(xué)習(xí)一下C++中的構(gòu)造函數(shù)
構(gòu)造函數(shù)是一種特殊的函數(shù),它用于在創(chuàng)建對(duì)象時(shí)初始化對(duì)象的值。在本文中,我們將學(xué)習(xí)C++的構(gòu)造函數(shù)以及如何使用它們來(lái)創(chuàng)建對(duì)象,希望對(duì)大家有所幫助2023-05-05

