C語言volatile關鍵字的作用與示例

更新時間：2023年04月10日 09:54:42 作者：程序員李哈

這篇文章主要介紹了C語言volatile關鍵字的作用，volatile提醒編譯器它后面所定義的變量隨時都有可能改變，因此編譯后的程序每次需要存儲或讀取這個變量的時候，都會直接從變量地址中讀取數據

寫在前面

版本信息：Linux操作系統(tǒng)，x86架構，Linux操作系統(tǒng)下GCC9.3.1版本。GCC 9.3.0手冊。

看了外面很多寫volatile的文章，筆者算是認為“亂七八糟”，根本沒有任何論證就在下定義，所以筆者特意寫這篇關于volatile的文章。

先看一下GCC文檔給的volatile說明：

一言以蔽之：讓編譯器不再去優(yōu)化被volatile修飾的變量的操作。但是volatile并不能做內存屏障的功能，想使用內存屏障請使用平臺相關的屏障指令，比如GCC提供了一個內聯asm volatile ("" : : : "memory");的編譯器屏障。詳情平臺相關的內存屏障請關注特定平臺的操作手冊~！

筆者有在很多帖子里面看過，他們都一致的說到：volatile可以作為內存屏障保證內存的可見性，這壓根就是一個錯誤的引導，所以這也促使筆者寫在這篇文章。

既然上述說明了volatile關鍵字可以避免編譯器優(yōu)化，那么下面筆者用2個列子來說明一下。

// 沒優(yōu)化：
int a = 10;
int b = a;
int c = a;
int d = a;
// 對應的匯編代碼
sub 16,esp             // 開辟棧幀
mov $10,(esp-12)       // 把立即數10放入到esp-12的棧幀位置，這也對應a變量。
mov (esp-12) (esp-8)   // 把(esp-12)的值放入到(esp-8)的位置，這也對應b變量
mov (esp-12) (esp-4)   // 把(esp-12)的值放入到(esp-4)的位置，這也對應c變量
mov (esp-12) (esp)     // 把(esp-12)的值放入到(esp)的位置，這也對應d變量
// 總結，每次從內存中拿

比如這個很簡單的列子，定義一個變量a，然后把a賦值給b、c、d。

看匯編代碼，可以清楚的看到，每次賦值都是從內存地址中拿去值，這也就需要訪問多次內存。影響到代碼的執(zhí)行效率。那么，編譯器會如何優(yōu)化呢？

既然b、c、d都使用的a變量，而A變量為10，那么可不可以這樣寫呢？

// 優(yōu)化：
int a = 10;
int b = 10;
int c = 10;
int d = 10;
// 對應的匯編代碼：
sub 16,esp        // 開辟棧幀
mov $10,(esp-12)  // 把立即數10放入到esp-12的棧幀位置，這也對應a變量。
mov (esp-12),eax  // 把esp-12的棧幀位置對應的值，也就是10放入到eax寄存器中。
mov eax (esp-8)   // 把eax寄存器的值放入到(esp-8)的位置，這也對應b變量
mov eax (esp-4)   // 把eax寄存器的值放入到(esp-4)的位置，這也對應c變量
mov eax (esp)     // 把eax寄存器的值放入到(esp)的位置，這也對應d變量
// 總結，每次從eax寄存器拿，此時，可以把eax想成一個緩存寄存器。

可以從匯編代碼看出，把a變量的值放入到eax寄存器中，然后把eax寄存器的值賦值給b、c、d變量，這樣就只需要訪問一次內存了。此時，我們需要考慮，假如賦值b、c、d的過程中，a的值發(fā)生了改變了呢？那么對于b、c、d來說還是賦值的原值，所以就出現了問題。

這是一個很簡單的編譯器優(yōu)化的例子，代碼就是假設的代碼，匯編也是偽匯編，那么，為得到讀者的認可，筆者也是寫了一個真實的案例。

// demo.c案例
#include <stdlib.h>
#include <stdio.h>
#include <pthread.h>
#include <errno.h>
/*全局變量*/
int gnum = 1;
/*線程1的服務程序*/
static void pthread_func_1 (void)
{
   while(gnum == 1){
   }
}
int main (void)
{
 /*線程的標識符*/
  pthread_t pt_1 = 0;
  int ret = 0;
  /*
    創(chuàng)建線程1
  */
  ret = pthread_create( &pt_1,                  //線程標識符指針
                                     NULL,                  //默認屬性
                                     (void *)pthread_func_1,//運行函數
                                     NULL);                  //無參數
  if (ret != 0)
  {
     perror ("pthread_1_create");
  }
  /* 主線程停1秒，讓p1線程成功被CPU調度 */
  sleep(1);
  /* 改變全局屬性gnum的值，讓p1線程停下來。 */
  gnum = 0;
  /* 等待線程1的結束 */
  pthread_join (pt_1, NULL);
  printf ("main programme exit!/n");
  return 0;
}

這段代碼很簡單，使用pthread創(chuàng)建一個p1線程，p1線程里面寫了一個while循環(huán)，循環(huán)條件是判斷全局變量gnum是否為1。main線程啟動p1線程，同時main線程休眠1秒，讓p1線程得到CPU的調度，然后把全局變量gnum設置為0，讓p1線程的while結束。main線程使用join等待p1線程執(zhí)行結束，p1線程結束后main線程打印main programme exit。

gcc普通編譯：

// gcc普通編譯后
gcc -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
000000000040068d <pthread_func_1>:
  40068d: 55                    push   %rbp
  40068e: 48 89 e5              mov    %rsp,%rbp
  400691: 90                    nop
  400692: 8b 05 bc 09 20 00     mov    0x2009bc(%rip),%eax        # 601054 <gnum>       // 每次還從0x2009bc(%rip)獲取全局的gnum變量放入eax寄存器
  400698: 83 f8 01              cmp    $0x1,%eax                                        // 拿1和eax寄存器做比較，比較結果放入到flags寄存器中。
  40069b: 74 f5                 je     400692 <pthread_func_1+0x5>                      // 如果比較成功就直接跳到400692這行代碼段地址，如果不成功就直接往下執(zhí)行
  40069d: 5d                    pop    %rbp
  40069e: c3                    retq

可以清楚的看到每次都是從0x2009bc(%rip)獲取值給%eax寄存器，然后cmp做比較，je是成功就跳轉到400692代碼段地址。然后繼續(xù)mov獲取值，cmp比較，je跳轉，周而復始......

gcc -O4編譯：

// gcc -O4編譯后
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: 83 3d 69 09 20 00 01  cmpl   $0x1,0x200969(%rip)        # 601060 <gnum>       // 比較一次，把結果放入到flags寄存器中
  4006f7: 75 07                 jne    400700 <pthread_func_1+0x10>                     // 如果不等于就直接退出
  4006f9: eb fe                 jmp    4006f9 <pthread_func_1+0x9>                      // 一直循環(huán)本行，也就是直接無腦死循環(huán)（沒有退出條件的死循環(huán)）
  4006fb: 0f 1f 44 00 00        nopl   0x0(%rax,%rax,1)
  400700: f3 c3                 repz retq 
  400702: 66 2e 0f 1f 84 00 00  nopw   %cs:0x0(%rax,%rax,1)
  400709: 00 00 00 
  40070c: 0f 1f 40 00           nopl   0x0(%rax)

這里執(zhí)行的話就直接死循環(huán)了。

這里也比較直觀，cmpl比較一次，如果不等于就jne直接返回，如果等于就執(zhí)行jmp 4006f9，就開始無退出條件的死循環(huán)了，不管你后續(xù)全局變量gnum值是否改變都無條件死循環(huán)。所以這就是編譯器優(yōu)化，導致的問題，那么使用volatile修飾全局變量gnum，看看效果。

volatile修飾后gcc -O4編譯：

// volatile修飾后gcc -O4編譯： 
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: 8b 05 5e 09 20 00     mov    0x20095e(%rip),%eax        # 601054 <gnum>       // 每次從0x20095e(%rip)獲取全局的gnum變量放入eax寄存器
  4006f6: 83 f8 01              cmp    $0x1,%eax                                        // 拿1和eax寄存器做比較，比較結果放入到flags寄存器中。
  4006f9: 74 f5                 je     4006f0 <pthread_func_1>                          // 如果比較成功就直接跳到4006f0這行代碼段地址，如果不成功就直接往下執(zhí)行
  4006fb: f3 c3                 repz retq 
  4006fd: 0f 1f 00              nopl   (%rax)

volatile 和gcc的O4優(yōu)化后的代碼特別特別的精簡。可以清楚的看到mov 0x20095e(%rip),%eax每次都從0x20095e(%rip)地址獲取變量給eax寄存器，然后cmp比較，je跳轉。所以這跟普通編譯的寫法是是一樣的（單指操作被volatile修飾的變量）

內聯匯編volatile修飾后gcc -O4編譯：

int gnum = 1;
/*線程1的服務程序*/
static void pthread_func_1 (void)
{
   while(gnum == 1){
     __asm__ __volatile__("": : :"memory")
   }
}

// 使用內聯匯編volatile編譯器優(yōu)化： 
gcc -O4 -pthread demo.c
// objdump指令查看反匯編
objdump -S a.out
// 反編譯后p1線程代碼段的匯編代碼
00000000004006f0 <pthread_func_1>:
  4006f0: eb 06                 jmp    4006f8 <pthread_func_1+0x8>
  4006f2: 66 0f 1f 44 00 00     nopw   0x0(%rax,%rax,1)
  4006f8: 83 3d 61 09 20 00 01  cmpl   $0x1,0x200961(%rip)        # 601060 <gnum>       // 拿0x200961(%rip)全局變量gnum的值和1比較。
  4006ff: 74 f7                 je     4006f8 <pthread_func_1+0x8>                      // 如果相等就跳轉到4006f8。
  400701: f3 c3                 repz retq 
  400703: 66 2e 0f 1f 84 00 00  nopw   %cs:0x0(%rax,%rax,1)
  40070a: 00 00 00 
  40070d: 0f 1f 00              nopl   (%rax)

這里cmpl直接比較，然后je跳轉。比較精簡。每次也是從0x200961(%rip)地址獲取最新值。所以不會出現無條件的死循環(huán)的情況。

volatile和內聯匯編的volatile的選擇

在Linux內核中，禁止volatile關鍵字的出現，但是里面都是使用內聯匯編volatile的形式禁止編譯器優(yōu)化，當然內存屏障也是可以禁止編譯器優(yōu)化的（對于內存屏障這里點到即可，詳情看不同平臺的操作手冊）。當然Linux內核代碼量特別大，如果很多地方不讓編譯器優(yōu)化的話，效率會降低，一個操作系統(tǒng)如果性能都不行，那肯定是說不過去的。

如下圖所示：使用了volatile修飾的變量在不同的代碼段之間執(zhí)行都會影響到代碼段的優(yōu)化，而內聯匯編volatile就可以按需選擇，就不會全部影響到。所以讀者可以按需選擇。

到此這篇關于C語言volatile關鍵字的作用與示例的文章就介紹到這了,更多相關C語言volatile關鍵字內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

C語言結構體的一些理解
這篇文章主要給大家介紹了關于C語言結構體的一些理解，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-11-11
CRITICAL_SECTION用法案例詳解
這篇文章主要介紹了CRITICAL_SECTION用法案例詳解,本篇文章通過簡要的案例,講解了該項技術的了解與使用,以下就是詳細內容,需要的朋友可以參考下
2021-08-08
詳解C/C++實現各種字符轉換方法合集
這篇文章主要為大家詳細介紹了C/C++中實現各種字符轉換的方法，文中的示例代碼講解詳細，對我們學習C++具有一定借鑒價值，需要的可以參考一下
2022-09-09
C++ auto類型說明符
在C++11中引入了auto類型說明符，用它就能讓編譯器替我們去分析表達式所屬的類型。當然，auto變量必須有初始值，這樣編譯器才能推斷其類型
2016-03-03
C語言超詳細講解函數指針的運用
函數指針是一個指針變量,它可以存儲函數的地址,然后使用函數指針,下面這篇文章主要給大家介紹了關于C語言進階教程之函數指針的相關資料,需要的朋友可以參考下
2022-06-06
基于C語言實現三子棋游戲的示例代碼
這篇文章主要為大家詳細介紹了如何利用C語言數組實現簡單的三子棋游戲，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-07-07
VSCode之CMake使用小結
本文主要介紹了VSCode之CMake使用小結,文中通過圖文介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
2024-03-03
C語言實現簡單彈跳小球
這篇文章主要為大家詳細介紹了C語言實現簡單彈跳小球，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2022-05-05
詳解windows下C/C++的內存泄露檢測
C/C++由于其沒有垃圾回收機制，所以內存的釋放一直以來都依靠于程序員的手工釋放，因此極其容易出現內存泄露的問題，而在比較大的程序之中，查找內存泄露是一件比較困難的事情，所以我們需要一些簡便的方法來檢測內存泄露，避免內存泄露導致設備崩潰
2021-06-06
C++指針學習詳解
指針在 C\C++ 語言中是很重要的內容,并且和指針有關的內容一向令初學者頭大,這篇文章主要給大家介紹了關于C/C++中指針的相關資料,需要的朋友可以參考下
2021-09-09