C++實現(xiàn)高并發(fā)異步定時器
在C++高并發(fā)場景,定時功能的實現(xiàn)有三大難題:高效、精準(zhǔn)、原子性。
除了定時任務(wù)隨時可能到期、而進程隨時可能要退出之外,最近Workflow甚至為定時任務(wù)增加了取消功能,導(dǎo)致任務(wù)可能被框架調(diào)起之前被用戶取消,或者創(chuàng)建之后不想執(zhí)行直接刪除等情況,而這些情況大部分來說都是由不同線程執(zhí)行的,因此其中的并發(fā)處理可謂教科書級別!
那么就和大家一起看看Workflow在定時器的設(shè)計上做了哪些考慮,深扒細(xì)節(jié),體驗并發(fā)架構(gòu)之美~
https://github.com/sogou/workflow
1. 高效的數(shù)據(jù)結(jié)構(gòu)與timerfd
舉個例子:實現(xiàn)一個server,收到請求之后,隔1s再回復(fù)給用戶。
聰明的讀者肯定知道,在server的執(zhí)行函數(shù)中用sleep(1)是不行的,sleep()這個系統(tǒng)調(diào)用是會阻塞當(dāng)前線程的,而異步編程里阻塞線程是高效的大忌!
所以我們可以使用timerfd,顧名思義就是用特定的fd來通知定時事件,把定時事件響應(yīng)和網(wǎng)絡(luò)事件響應(yīng)都一起處理,用epoll管理就是一把梭。
現(xiàn)在離高效還差一點。回到例子,我們不可能每次收到一個請求都創(chuàng)建一個timerfd,因為高并發(fā)場景下一個server通常要抗上百萬的QPS。
目前Workflow的超時算法做法是:一個poller有一個timerfd,內(nèi)部利用了鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu),時間復(fù)雜度在O(1)和O(logn)之間,其中n為poller線程的fd數(shù)量。

2. 精準(zhǔn)的響應(yīng)
這樣的數(shù)據(jù)結(jié)構(gòu)設(shè)計有什么好處呢?
- 寫得快(放入一個新節(jié)點)
- 讀得快(響應(yīng)已超時的節(jié)點)
- 精度高(超時時間無精度損失)
Workflow源碼在kernel和factory目錄中都有對應(yīng)的實現(xiàn),kernel層是主要負(fù)責(zé)timerfd的地方,當(dāng)前factory層還比較薄。我們重點看看上述數(shù)據(jù)結(jié)構(gòu)。
寫:由用戶發(fā)起異步任務(wù),將這個任務(wù)加到上述的鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu)中,如果這個超時是當(dāng)前最小的超時時間,還會更新一下timerfd。
讀:框架的網(wǎng)絡(luò)線程每次會從epoll拿出事件,如果響應(yīng)到超時事件,會把數(shù)據(jù)結(jié)構(gòu)中已經(jīng)超時的全部節(jié)點都拿出來,并調(diào)用任務(wù)的handle。
以下是從epoll處理超時事件的關(guān)鍵函數(shù):
/*** poller響應(yīng)timerfd的到時事件,并處理所有到時的定時任務(wù) ***/
static void __poller_handle_timeout(const struct __poller_node *time_node, poller_t *poller)
{
...
// 鎖里,把list與rbtree上時間已到的節(jié)點都從數(shù)據(jù)結(jié)構(gòu)里刪除,臨時放到一個局部變量上
list_for_each_safe(pos, tmp, &poller->timeo_list)
{
...
node->removed = 1; // 標(biāo)志位:【removed】
...
}
if (poller->tree_first)
{ ... }
// 鎖外,設(shè)置state和error,并回調(diào)Task的handle()函數(shù)
while (!list_empty(&timeo_list))
{
node = list_entry(timeo_list.next, struct __poller_node, list);
list_del(&node->list);
node->error = ETIMEDOUT;
node->state = PR_ST_ERROR;
free(node->res);
poller->cb((struct poller_result *)node, poller->ctx);
}
}由于timerfd使用的超時時間是所有節(jié)點中最早超時的時間,而所有節(jié)點都在rbtree和list上按序排好,我們從前到后找的都是已超時的節(jié)點。因此利用了timerfd的精準(zhǔn)性可以非常準(zhǔn)確地叫醒當(dāng)前已經(jīng)超時的全部節(jié)點,無精度損失。
由于實際使用中,用戶使用的超時時長總是傾向于固定的,比如上述例子都是1s,因此超時的絕對時間一般來說都是遞增的,使用這個數(shù)據(jù)結(jié)構(gòu)寫入會非??欤O(shè)計特別適合定時器的實際需求。
3. 原子性
上述有提到,用戶的回調(diào)需要調(diào)且只調(diào)一次,Workflow可以保證在進程退出時立刻全部立刻到時結(jié)束。進程退出又是另一個話題,感興趣的讀者先自行去看代碼,回頭再細(xì)說~
4.允許取消(新功能)
看到這里,已經(jīng)可以感受到優(yōu)雅的數(shù)據(jù)結(jié)構(gòu)如何實現(xiàn)高效精準(zhǔn)的定時器了~
但是當(dāng)我們打開poller.h,感受一下它的接口,總覺得差了點什么:

是的!一個timer可以add,但是卻不可以delete!
Workflow中許多結(jié)構(gòu)的實現(xiàn)都是非常完備和對稱的,因此取消一個定時任務(wù)這件事在Workflow開源的第一天就一直想要實現(xiàn)。
但是多加一個取消cancel會有很大的問題:如果一個timer已經(jīng)timeout,用戶再去cancel的生命周期是沒有辦法保證的,它可能已經(jīng)析構(gòu)了!
最近終于找到了一個非常好的解決辦法:使用命名timer,交給全局map管,cancel的時候帶名字去操作,就可以解決生命周期問題。
我們增加了帶名字的Timer :__WFNamedTimerTask,通過全局的map可以找到它,從而進行刪除。刪除實際上就是從poller中刪除一個timer。
所以從底向上,為孤獨的poller_add_time增加一個小伙伴:poller_del_timer。
/*** 取消一個定時任務(wù)時,從poller刪除它 ***/
int poller_del_timer(void *timer, poller_t *poller)
{
...
// 鎖內(nèi):如果這個標(biāo)志位還是0,表示stop還沒把它拿走,這里就可以去刪除這個timer
if (!node->removed)
{
node->removed = 1; // 可以讓cancel和stop互斥,保證只調(diào)一次
if (node->in_rbtree) // 從定時器的數(shù)據(jù)結(jié)構(gòu)中刪掉
__poller_tree_erase(node, poller);
else
list_del(&node->list);
node->error = 0;
node->state = PR_ST_DELETED;
stopped = poller->stopped;
if (!stopped) // 標(biāo)志位【stopped】,如果當(dāng)時沒有進程退出,把timer事件交出去處理
write(poller->pipe_wr, &node, sizeof (void *));
}
...
// 鎖外:標(biāo)志位【stopped】如果進程要退出了,立刻處理timer事件的handle
if (stopped)
poller->cb((struct poller_result *)node, poller->ctx);
return -!node;
}剛才講述過的timeout(時間到)、stop(進程退出)、cancel(用戶取消)三者可能由三個線程分別發(fā)起,于是我們看到的并發(fā)狀態(tài),簡單來說是這樣的:

定時器到期(timeout)、進程退出(stop)、任務(wù)取消(cancel)三者隨時可能發(fā)生!
5. 精妙的并發(fā)狀態(tài)分析
cancel和另外兩個行為有著本質(zhì)上的不同:
- timeout和stop的觸發(fā)順序是先poller層、再到Task層,最后到用戶的callbback;
- cancel的觸發(fā)先Task層,Task層的命名map中先刪掉它觸發(fā)、再到poller層,最后到用戶的callback;
因此先討論第一類情況。
我們以timeout為例:
- poller層面的
__poller_handle_timeout()會把上述的removed標(biāo)志位用上,與poller_del_timer()互斥:誰第一個搶到removed標(biāo)志位并置為1,就代表了timer結(jié)束于哪個狀態(tài)。如果是timeout,那么用戶拿到的state為SS_STATE_COMPLETE; - 互斥鎖
poller->mutex保證從poller的數(shù)據(jù)結(jié)構(gòu)中刪掉這個節(jié)點并調(diào)Task層回調(diào),從而可以保證stop的時候無需重復(fù)處理它; - timeout調(diào)用的Task層回調(diào),實際上是__WFNamedTimerTask::handle():
(1) 它會置一個標(biāo)志位node_.task,表示此任務(wù)已經(jīng)處理過;
(2) 并且把這個節(jié)點從全局map中刪除:這樣就保證了用戶自頂向下cancel就不會刪到它了;
/*** 處理定時器到期,由poller調(diào)用 ***/
void __WFNamedTimerTask::handle(int state, int error)
{
if (node_.task) // 由于不想先加鎖再處理,所以先判斷任務(wù)沒有被cancel處理過
{
std::lock_guard<std::mutex> lock(__timer_map.mutex_);
if (node_.task) // 鎖內(nèi)再檢查一下,入門技能
{
timers_->del(&node_, &__timer_map.root_); // 從map中刪除
node_.task = NULL; // 標(biāo)志位:表示任務(wù)生命周期結(jié)束了
}
}
mutex_.lock(); // 這里是為了等待dispatch流程保證exchange已經(jīng)結(jié)束,
mutex_.unlock(); // 否則資源被釋放就不能訪問成員變量了。也是非常常用的技巧!
this->__WFTimerTask::handle(state, error); // 里邊會釋放資源,并發(fā)起任務(wù)流下一個任務(wù)
}第二類情況,如果用戶調(diào)用cancel先發(fā)生呢?
- 自頂向下先由factory層找到這個節(jié)點,再調(diào)到poller的
poller_del_timer()。期間需要記錄一些狀態(tài),因為我們需要通常有多個poller。然后內(nèi)部會先置上removed,并從定時器數(shù)據(jù)結(jié)構(gòu)中刪掉,以保證和timeout流程互斥; - 在Task層面,需要由cancel流程負(fù)責(zé)調(diào)用用戶的callback(),同時回收timer的資源;

void __NamedTimerMap::cancel(const std::string& name, size_t max)
{
...
// 鎖內(nèi),拿出命名為name的timer隊列
timers = __get_object_list<TimerList>(name, &root_, false);
if (timers)
{
do
{
if (max == 0) // 從map中刪除最多max個
return;
// 從該名字對應(yīng)的隊列中刪除該timer
node = list_entry(timers->head.next, struct __timer_node, list);
list_del(&node->list);
// 標(biāo)識位:exchange。如果是第二次exchange,會調(diào)到task自身的cancel()從poller中刪掉它
if (node->task->flag_.exchange(true))
node->task->cancel();
// 標(biāo)志位:表示生命周期正確結(jié)束,資源已經(jīng)被回收,否則timeout流程或析構(gòu)函數(shù)需要做回收
node->task = NULL;
max--;
} while (!timers->empty());
rb_erase(&timers->rb, &root_);
delete timers;
}
}6. 異步任務(wù)的發(fā)起時機是個謎
上面那張圖,我們假設(shè)的是任務(wù)先創(chuàng)建好,再被發(fā)起。那如果任務(wù)還沒有被發(fā)起,甚至我們不想發(fā)起呢?
我們假設(shè)的是任務(wù)先創(chuàng)建好,再被發(fā)起。那如果任務(wù)還沒有被發(fā)起,甚至我們不想發(fā)起呢?
1、任務(wù)可以在被發(fā)起前取消
實際上我們把一個timer放到一個任務(wù)流圖中,我們并不能確定它被發(fā)起的準(zhǔn)確的時機,但我們依然允許先cancel它。

這時候我們就需要上述的標(biāo)志位exchange來做互斥了。exchange是個std::atomic<tool>,初始化為false,用戶已經(jīng)手動cancel過之后,任務(wù)可能在任務(wù)流中才會被發(fā)起dispatch。
因此即使先取消,沒關(guān)系,但必須保證dispatch過才能釋放這個timer的資源:
/*** 由任務(wù)流發(fā)起、或者用戶手動start起來 ***/
void __WFNamedTimerTask::dispatch()
{
int ret;
mutex_.lock();
ret = this->scheduler->sleep(this); // 先把定時任務(wù)交給poller
if (ret >= 0 && flag_.exchange(true)) // exchange一下。如果是第二個調(diào)用exchange的人,會拿到true
this->cancel(); // 說明發(fā)起之前已經(jīng)有人cancel過了,立刻從poller中刪除即可
mutex_.unlock();
if (ret < 0)
this->handle(SS_STATE_ERROR, errno);
}這里有兩個要注意的點:
- 通過
sleep()交給poller之后,用戶的callback可以在網(wǎng)絡(luò)線程中處理,而不是當(dāng)前線程立刻處理,這樣可以遞歸爆棧問題; - 如果過期時間非常短,
sleep()之后是隨時有可能到期并回到__WFNamedTimerTask::handle()的!因此前面對mutex_.lock()和mutex_.unlock()等的就是這里的flag_.exchange(true)執(zhí)行結(jié)束;
2. 任務(wù)甚至可以不發(fā)起
而如果創(chuàng)建完之后不想發(fā)起,Workflow統(tǒng)一的接口是需要調(diào)用一下task->dismiss(),以釋放task資源,調(diào)用析構(gòu)函數(shù)等。
/*** 命名定時任務(wù)的析構(gòu)函數(shù),異步任務(wù)需要注意處理各種情況的資源回收 ***/
virtual ~__WFNamedTimerTask()
{
if (node_.task) // 標(biāo)志位:如果沒有置空,說明任務(wù)沒有發(fā)起過。需要從全局map中刪掉這個timer
{
std::lock_guard<std::mutex> lock(__timer_map.mutex_);
if (node_.task) // 鎖內(nèi)再檢查一次
timers_->del(&node_, &__timer_map.root_);
}
}7. 總結(jié)
最后貼一段代碼看看,一個高并發(fā)1s定時返回的server代碼,用Workflow實現(xiàn)可以多簡單:
int main()
{
WFHttpServer server([](WFHttpTask * task)
{
task->get_resp()->append_output_body("<html>will response after 1s</html>");
auto timer = WFTaskFactory::create_timer_task(1, 0, nullptr);
series_of(task)->push_back(timer);
});
if (server.start(1412) == 0)
{
getchar();
server.stop();
}
return 0;
}本篇介紹了如何優(yōu)雅地處理異步任務(wù)的:創(chuàng)建、發(fā)起、回調(diào)、取消、進程退出多種并發(fā)行為,其中包含了許多常用的技巧!不記得的小伙伴自行翻回去再看一遍._.
當(dāng)然這在并發(fā)的世界中還只是冰山一角,因為很有可能寫下某一句話的時機不對,任務(wù)一結(jié)束,程序就GG了。
以上就是C++實現(xiàn)高并發(fā)異步定時器的詳細(xì)內(nèi)容,更多關(guān)于C++定時器的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
C++實現(xiàn)LeetCode(152.求最大子數(shù)組乘積)
這篇文章主要介紹了C++實現(xiàn)LeetCode(152.求最大子數(shù)組乘積),本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細(xì)內(nèi)容,需要的朋友可以參考下2021-07-07
Windows下ncnn環(huán)境配置教程詳解(VS2019)
這篇文章主要介紹了Windows下ncnn環(huán)境配置(VS2019),本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03
C語言數(shù)據(jù)結(jié)構(gòu)不掛科指南之隊列詳解
這篇博客主要介紹一下隊列的概念,并且采用 C 語言,編寫兩種存儲實現(xiàn)方式:順序存儲和鏈?zhǔn)酱鎯?,?dāng)然還有常規(guī)的隊列基本操作的實現(xiàn)算法2022-09-09

