elasticsearch的靈魂唯一master選舉機制原理分析

更新時間：2022年04月21日 14:34:58 作者：zziawan

這篇文章主要為大家介紹了elasticsearch的靈魂唯一master選舉機制原理分析，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪

master作為cluster的靈魂必須要有，還必須要唯一，否則集群就出大問題了。因此master選舉在cluster分析中尤為重要。對于這個問題我將分兩篇來分析。第一篇也就是本篇，首先會簡單說一說mater選舉的一些算法，及elasticsearch的選舉原理。第二篇也就是下一篇，會結合zenDiscovery代碼為仔細分析elasticsearch的master選舉的實現(xiàn)。

簡單來說master的作用跟單個jvm中的同步關鍵字synchronized相同，集群中多節(jié)點協(xié)調(diào)工作必須要保證數(shù)據(jù)的一致性，但是不同節(jié)點分布在不同的jvm中，不可能用jvm的同步機制。所以需要一個“鎖”，節(jié)點操作集群中的資源時都通過它來解決一致性問題，這就是master。關于分布式系統(tǒng)的master選舉算法有很多，最有名的當然要數(shù)paxos算法，在它的基礎上出現(xiàn)了非常多的變體算法。關于這個算法請參考相關網(wǎng)頁和資料，不是一兩句話能說清楚的，這里不再祥述。但是paxos的功能遠遠超出了master選舉，一致性向才是它的目標，任何需要實現(xiàn)一致性的問題都可以使用該算法，因此zookeeper功能遠遠不止master選舉。

還有一種比較簡單的算法就是Bully，它通過一定的直接給每個節(jié)點賦予一唯一的ID，這些ID是可以排序的，每次master選舉都會選舉ID最大的節(jié)點。這種實現(xiàn)非常簡單。但是會存在一些問題，在master負載過重時它會假死，于是第二大節(jié)點就成為了master節(jié)點。因此假死m(xù)aster節(jié)點因負載減輕又活了過來，于是他又被選為master，然后又假死……，這種情況可能一直存在導致系統(tǒng)不穩(wěn)定。

集群還有一個問題就是brain split：一個集群因為網(wǎng)絡問題導致多個master選舉出來而分裂。這也是master選舉必須要解決的問題。elasticsearch的master選舉原理我覺得是在bully的基礎上做了改進。相比于paxos實現(xiàn)的zookeeper它完美的解決了master選舉問題，但不如zookeeper強大，因為zookeeper功能遠遠超出了master選舉，它的master選舉卻不需要這么多功能。它原理如下：

對所有可以成為master的節(jié)點根據(jù)nodeId排序，每次選舉每個節(jié)點都把自己所知道節(jié)點排一次序，然后選出第一個（第0位）節(jié)點，暫且認為它是master節(jié)點。
如果對某個節(jié)點的投票數(shù)達到一定的值（可以成為master節(jié)點數(shù)n/2+1）并且該節(jié)點自己也選舉自己，那這個節(jié)點就是master。否則重新選舉。
對于brain split問題，需要把候選master節(jié)點最小值設置為可以成為master節(jié)點數(shù)n/2+1（quorum ）

以上就是master選舉的三條原則，其實第三天包含在第二條之中，為了說明brain split問題這里單獨拿出來說一下。下面看一下ElectMasterService的相關代碼，來補充說明一下一上的文字描述：

public DiscoveryNode electMaster(Iterable<DiscoveryNode> nodes) {
        List<DiscoveryNode> sortedNodes = sortedMasterNodes(nodes);
        if (sortedNodes == null || sortedNodes.isEmpty()) {
            return null;
        }
        return sortedNodes.get(0);
    }

上面就是選舉master的方法，可以看到，它的做法就是對候選節(jié)點排序然后直接將第一個返回。當然這只是上面所說的第一條。其實只有這個是不能夠保證maser選舉順利的，之前也看到一些文章分析elasticsearch的master選舉，只提到了這個點和這一部分代碼，應該是作者沒有仔細研究Discovery代碼而導致的疏忽。如果每個節(jié)點都只是選舉自己排序后的節(jié)點的第一個肯定會導致brain split和選舉不一致。master比較的方法也比較簡單如下所示：

private static class NodeComparator implements Comparator<DiscoveryNode> {

        @Override
        public int compare(DiscoveryNode o1, DiscoveryNode o2) {
            if (o1.masterNode() && !o2.masterNode()) {
                return -1;
            }
            if (!o1.masterNode() && o2.masterNode()) {
                return 1;
            }
            return o1.id().compareTo(o2.id());
        }
    }

以上是節(jié)點排序比較器，可以看到它只是比較了nodeId，因此是按nodeId排序。從這兩兩段代碼來看很像是bully算法的實現(xiàn)。為了解決brain split問題開發(fā)者加入了master候選數(shù)據(jù)量限制，代碼如下：

public boolean hasEnoughMasterNodes(Iterable<DiscoveryNode> nodes) {
        if (minimumMasterNodes < 1) {
            return true;
        }
        int count = 0;
        for (DiscoveryNode node : nodes) {
            if (node.masterNode()) {
                count++;
            }
        }
        return count >= minimumMasterNodes;
    }

通過比較節(jié)點能“看到”的候選master數(shù)量和配置的最小值來確定是否可以進行選舉，如果數(shù)量不夠會導致選舉不能進行，這樣就可以保證集群不會被分裂。下面以一個圖(圖片來自于elasticsearch官網(wǎng))來說明:

假設之前選舉了A節(jié)點為master，兩個switch之間突然斷線了，這樣就分詞了兩部分。CDE和AB，因為 minimumMasterNodes的數(shù)目為3（集群中5個節(jié)點都可以成為master，3=5/2+1），因此cde會可以進行選舉假設C成為master。AB兩個節(jié)點因為少于3所以無法選舉，只能一直尋求加入集群，要么線路連通加入到CDE中要么就一直處于尋找集群狀態(tài)，這樣就保證了集群不分裂。

總結一下，本篇介紹了master選舉的兩種算法和elasticsearch的選舉原理，并分析了它原理中的兩條，第二條將在下一篇discovery中接下分析。

以上就是elasticsearch的靈魂唯一master選舉機制原理分析的詳細內(nèi)容，更多關于elasticsearch唯一master選舉機制的資料請關注腳本之家其它相關文章！

您可能感興趣的文章:

Java_Spring之Spring5?的新特性
這篇文章主要介紹了Java_Spring中Spring5?的新特性，需要利用jdk8?版本更新的內(nèi)容，依賴庫更新，感興趣的小伙伴可以參考閱讀
2023-04-04
Java如何向指定文件操作一段內(nèi)容(增加,刪除均可使用本方法)
這篇文章主要介紹了Java如何向指定文件操作一段內(nèi)容(增加,刪除均可使用本方法),具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-12-12
Spring Cloud Gateway網(wǎng)關XSS過濾方式
這篇文章主要介紹了Spring Cloud Gateway網(wǎng)關XSS過濾方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2021-10-10
Java利用docx4j+Freemarker生成word文檔
這篇文章主要為大家詳細介紹了Java如何利用docx4j+Freemarker生成word文檔,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下
2025-04-04
Spring集成Seata方式(案例演示)
這篇文章主要介紹了Spring集成Seata方式,本案例使用Seata-All演示,結合實例代碼給大家講解的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2023-08-08
Java實現(xiàn)記事本功能
這篇文章主要為大家詳細介紹了Java實現(xiàn)記事本功能，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2017-06-06
關于@Value注解失效的原因分析
這篇文章主要介紹了關于@Value注解失效的原因分析,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-09-09
Spring中BeanFactory和ApplicationContext的作用和區(qū)別(推薦)
這篇文章主要介紹了Spring中BeanFactory和ApplicationContext的作用和區(qū)別,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2020-09-09
Maven使用方法詳及方式詳細介紹
使用maven倉庫的話需要從網(wǎng)上下載maven的包，比如“apache-maven-3.5.4-bin.tar”，下載完成之后解壓，在解壓的文件夾中的conf目錄下的settings.xml文件夾下就可以配置maven遠程倉庫和本地倉庫的地址
2022-11-11
Java反射根據(jù)不同方法名動態(tài)調(diào)用不同的方法(實例)
下面小編就為大家?guī)硪黄狫ava反射根據(jù)不同方法名動態(tài)調(diào)用不同的方法(實例)。小編覺得挺不錯的，現(xiàn)在就分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2016-08-08