詳解linux系統(tǒng)調用原理
操作系統(tǒng)通過系統(tǒng)調用為運行于其上的進程提供服務。
當用戶態(tài)進程發(fā)起一個系統(tǒng)調用, CPU 將切換到 內核態(tài) 并開始執(zhí)行一個 內核函數 。 內核函數負責響應應用程序的要求,例如操作文件、進行網絡通訊或者申請內存資源等。
舉一個最簡單的例子,應用進程需要輸出一行文字,需要調用 write 這個系統(tǒng)調用:
hello_world.c
#include <string.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
char *msg = "Hello, world!\n";
write(1, msg, strlen(msg));
return 0;
}
注解
讀者可能會有些疑問——輸出文本不是用 printf 等函數嗎?
確實是。 printf 是更高層次的庫函數,建立在系統(tǒng)調用之上,實現數據格式化等功能。 因此,本質上還是系統(tǒng)調用起決定性作用。
調用流程
那么,在應用程序內,調用一個系統(tǒng)調用的流程是怎樣的呢?
我們以一個假設的系統(tǒng)調用 xyz 為例,介紹一次系統(tǒng)調用的所有環(huán)節(jié)。

如上圖,系統(tǒng)調用執(zhí)行的流程如下:
- 應用程序 代碼調用系統(tǒng)調用( xyz ),該函數是一個包裝系統(tǒng)調用的 庫函數 ;
- 庫函數 ( xyz )負責準備向內核傳遞的參數,并觸發(fā) 軟中斷 以切換到內核;
- CPU 被 軟中斷 打斷后,執(zhí)行 中斷處理函數 ,即 系統(tǒng)調用處理函數 ( system_call );
- 系統(tǒng)調用處理函數 調用 系統(tǒng)調用服務例程 ( sys_xyz ),真正開始處理該系統(tǒng)調用;
執(zhí)行態(tài)切換
應用程序 ( application program )與 庫函數 ( libc )之間, 系統(tǒng)調用處理函數 ( system call handler )與 系統(tǒng)調用服務例程 ( system call service routine )之間, 均是普通函數調用,應該不難理解。 而 庫函數 與 系統(tǒng)調用處理函數 之間,由于涉及用戶態(tài)與內核態(tài)的切換,要復雜一些。
Linux 通過 軟中斷 實現從 用戶態(tài) 到 內核態(tài) 的切換。 用戶態(tài) 與 內核態(tài) 是獨立的執(zhí)行流,因此在切換時,需要準備 執(zhí)行棧 并保存 寄存器 。
內核實現了很多不同的系統(tǒng)調用(提供不同功能),而 系統(tǒng)調用處理函數 只有一個。 因此,用戶進程必須傳遞一個參數用于區(qū)分,這便是 系統(tǒng)調用號 ( system call number )。 在 Linux 中, 系統(tǒng)調用號 一般通過 eax 寄存器 來傳遞。
總結起來, 執(zhí)行態(tài)切換 過程如下:
- 應用程序 在 用戶態(tài) 準備好調用參數,執(zhí)行 int 指令觸發(fā) 軟中斷 ,中斷號為 0x80 ;
- CPU 被軟中斷打斷后,執(zhí)行對應的 中斷處理函數 ,這時便已進入 內核態(tài) ;
- 系統(tǒng)調用處理函數 準備 內核執(zhí)行棧 ,并保存所有 寄存器 (一般用匯編語言實現);
- 系統(tǒng)調用處理函數 根據 系統(tǒng)調用號 調用對應的 C 函數—— 系統(tǒng)調用服務例程 ;
- 系統(tǒng)調用處理函數 準備 返回值 并從 內核棧 中恢復 寄存器 ;
- 系統(tǒng)調用處理函數 執(zhí)行 ret 指令切換回 用戶態(tài) ;
編程實踐
下面,通過一個簡單的程序,看看應用程序如何在 用戶態(tài) 準備參數并通過 int 指令觸發(fā) 軟中斷 以陷入 內核態(tài) 執(zhí)行 系統(tǒng)調用 :
hello_world-int.S
.section .rodata msg: .ascii "Hello, world!\n" .section .text .global _start _start: # call SYS_WRITE movl $4, %eax # push arguments movl $1, %ebx movl $msg, %ecx movl $14, %edx int $0x80 # Call SYS_EXIT movl $1, %eax # push arguments movl $0, %ebx # initiate int $0x80
這是一個匯編語言程序,程序入口在 _start 標簽之后。
第 12 行,準備 系統(tǒng)調用號 :將常數 4 放進 寄存器 eax 。 系統(tǒng)調用號 4 代表 系統(tǒng)調用 SYS_write , 我們將通過該系統(tǒng)調用向標準輸出寫入一個字符串。
第 14-16 行, 準備系統(tǒng)調用參數:第一個參數放進 寄存器 ebx ,第二個參數放進 ecx , 以此類推。
write 系統(tǒng)調用需要 3 個參數:
- 文件描述符 ,標準輸出文件描述符為 1 ;
- 寫入內容(緩沖區(qū))地址;
- 寫入內容長度(字節(jié)數);
第 17 行,執(zhí)行 int 指令觸發(fā)軟中斷 0x80 ,程序將陷入內核態(tài)并由內核執(zhí)行系統(tǒng)調用。 系統(tǒng)調用執(zhí)行完畢后,內核將負責切換回用戶態(tài),應用程序繼續(xù)執(zhí)行之后的指令( 從 20 行開始 )。
第 20-24 行,調用 exit 系統(tǒng)調用,以便退出程序。
注解
注意到,這里必須顯式調用 exit 系統(tǒng)調用退出程序。 否則,程序將繼續(xù)往下執(zhí)行,最終遇到段錯誤( segmentation fault )!讀者可能很好奇——我在寫 C 語言或者其他程序時,這個調用并不是必須的!
這是因為 C 庫( libc )已經幫你把臟活累活都干了。
接下來,我們編譯并執(zhí)行這個匯編語言程序:
$ ls hello_world-int.S $ as -o hello_world-int.o hello_world-int.S $ ls hello_world-int.o hello_world-int.S $ ld -o hello_world-int hello_world-int.o $ ls hello_world-int hello_world-int.o hello_world-int.S $ ./hello_world-int Hello, world!
其實,將 系統(tǒng)調用號 和 調用參數 放進正確的 寄存器 并觸發(fā)正確的 軟中斷 是個重復的麻煩事。 C 庫已經把這臟累活給干了——試試 syscall 函數吧!
hello_world-syscall.c
#include <string.h>
#include <sys/syscall.h>
#include <unistd.h>
int main(int argc, char *argv[])
{
char *msg = "Hello, world!\n";
syscall(SYS_write, 1, msg, strlen(msg));
return 0;
}
相關文章
centOS7.4 安裝 mysql 5.7.26的教程詳解
CentOS中默認安裝有MariaDB,這個是MySQL的分支,但為了需要,還是要在系統(tǒng)中安裝MySQL,而且安裝完成之后可以直接覆蓋掉MariaDB。這篇文章主要介紹了centOS7.4 安裝 mysql 5.7.26,需要的朋友可以參考下2019-06-06

