SpringBoot?Seata?死鎖問(wèn)題排查記錄
現(xiàn)象描述:Spring Boot項(xiàng)目,啟動(dòng)的時(shí)候卡住了,一直卡在那里不動(dòng),沒(méi)有報(bào)錯(cuò),也沒(méi)有日志輸出

但是,奇怪的是,本地可以正常啟動(dòng)

好吧,姑且先不深究為什么本地可以啟動(dòng)而部署到服務(wù)器上就無(wú)法啟動(dòng)的問(wèn)題,這個(gè)不是重點(diǎn),重點(diǎn)是怎么讓它啟動(dòng)起來(lái)。(PS:我猜測(cè)可能是環(huán)境不同造成的,包括操作系統(tǒng)不同和JDK版本不同)
遇到這種情況,我先用jstack查看堆棧情況,果然發(fā)現(xiàn)了死鎖

拿到j(luò)stack的完整信息,然后仔細(xì)排查,看不懂的話(huà)也可以借助工具


分析了每個(gè)被阻塞的線(xiàn)程之后,發(fā)現(xiàn)main線(xiàn)程和timeoutChecker_1_1互相等待對(duì)方持有的鎖,從而形成了死鎖
可以通過(guò) jconsole 和 jvisualvm 查看

需要注意,如果是查看遠(yuǎn)程進(jìn)程,則需要加一些啟動(dòng)參數(shù)
- -Dcom.sun.management.jmxremote:?jiǎn)⒂肑MX
- -Dcom.sun.management.jmxremote.port=<端口號(hào)>:指定JMX遠(yuǎn)程連接的端口號(hào)
- -Dcom.sun.management.jmxremote.authenticate=false:禁用JMX遠(yuǎn)程連接的認(rèn)證
- -Dcom.sun.management.jmxremote.ssl=false:禁用JMX遠(yuǎn)程連接的SSL加密
于是,我又重啟啟動(dòng)
java -jar -Dcom.sun.management.jmxremote -Dcom.sun.management.jmxremote.port=9099 -Dcom.sun.management.jmxremote.authenticate=false -Dcom.sun.management.jmxremote.ssl=false app.jar
通過(guò)jps或者ps命令查找應(yīng)用的pid





用jvisualvm查看也可以,不再贅述,結(jié)果都是一樣的


好了,工具介紹到此為止,下面重點(diǎn)看代碼

main線(xiàn)程持有<0x00000000c07a33d8>這個(gè)對(duì)象的鎖,同時(shí)它還需要<0x00000000ff295ca8>對(duì)象的鎖,而timeoutChecker_1_1線(xiàn)程正好相反,于是死鎖了
main線(xiàn)程很好理解,就是我們這個(gè)SpringBoot應(yīng)用的主線(xiàn)程,但是timeoutChecker_1_1線(xiàn)程是哪兒來(lái)的呢,通過(guò)分析發(fā)現(xiàn)它來(lái)自Seata
對(duì)了,該項(xiàng)目中Spring Boot版本是2.6.6,Seata版本是1.4.2
找到timeoutChecker的出處了



延遲60秒啟動(dòng)定時(shí)任務(wù),每隔10秒執(zhí)行一次,調(diào)用io.seata.core.rpc.netty.NettyClientChannelManager#reconnect()


記住這一行,首先調(diào)用RegistryFactory.getInstance()獲取一個(gè)RegistryService,然后調(diào)用RegistryService對(duì)象的lookup()方法


接著看1.4.2

最重要的是 EnhancedServiceLoader.load(ExtConfigurationProvider.class).provide(configuration);

所以,ExtConfigurationProvider 是 SpringBootConfigurationProvider



回到seata-1.4.2,可以看到這里調(diào)用了applicationContext.getBean(),于是DefaultListableBeanFactory.getBean()





可以看到,getSingletonFactoryBeanForTypeCheck()方法里,對(duì)singletonObjects加了同步鎖
凡是通過(guò)DefaultSingletonBeanRegistry#getSingleton()獲取單例Bean的都會(huì)先對(duì)singletonObjects加鎖
接下來(lái)看lookup


可以看到,NacosRegistryServiceImpl的lookup()這里也加了鎖。另外,getNamingProperties()的時(shí)候由于再次用到了ConfigurationFactory.CURRENT_FILE_INSTANCE,所以又到了SpringBootConfigurationProvider#provide()
至此,Seata整個(gè)定時(shí)任務(wù)啟動(dòng)的主要邏輯我們都梳理完了,幾處加鎖的也都找到了

這些加鎖的地方也就是容易出現(xiàn)死鎖的地方
死鎖是由于加鎖順序不一致造成的
下面看main線(xiàn)程啟動(dòng)
由于SeataDataSourceBeanPostProcessor實(shí)現(xiàn)了BeanPostProcessor接口,所以在創(chuàng)建容器之后會(huì)回調(diào)其postProcessAfterInitialization()方法









所以,最終還是調(diào)NettyClientChannelManager#reconnect()

Spring啟動(dòng)的時(shí)候去創(chuàng)建Spring容器,后面就是Spring那一套
ConfigurableApplicationContext#refresh()
ServletWebServerApplicationContext#refresh()

不再贅述
由于需要注入依賴(lài),所以,這個(gè)過(guò)程中肯定會(huì)多次調(diào)用 AbstractBeanFactory.getBean()
前面我們講過(guò),DefaultSingletonBeanRegistry.getSingleton() 時(shí)是加了鎖的。因此,main線(xiàn)程很有可能會(huì)先持有該鎖,當(dāng)初始化到Seata的時(shí)候,又要獲取該鎖,于是出現(xiàn)了鎖爭(zhēng)用。

由于兩個(gè)線(xiàn)程對(duì)同一資源的加鎖順序不一致,導(dǎo)致死鎖。
由于timeoutChecker是定時(shí)任務(wù)每隔10秒啟一次,所以第二次加鎖順序變成231
好了,關(guān)于main線(xiàn)程和timeoutChecker線(xiàn)程死鎖的分析就先到這里了
現(xiàn)在,回到項(xiàng)目中來(lái),由于我們的項(xiàng)目中有一個(gè)比較耗時(shí)的操作,超時(shí)時(shí)間固定是60秒,這個(gè)方法本來(lái)應(yīng)該在Seata代理數(shù)據(jù)源之后做,不知道為什么服務(wù)器上先執(zhí)行了,導(dǎo)致main線(xiàn)程等待了60秒,之后才執(zhí)行SeataDataSourceBeanPostProcessor#postProcessAfterInitialization()

最終解決方法時(shí)將@PostConstruct注解去掉,不在容器初始化的時(shí)候取做這么耗時(shí)的操作
如果采用Seata-1.5.2版本的話(huà),可能也不會(huì)出現(xiàn)死鎖問(wèn)題
參考資料
jconsole遠(yuǎn)程連接失敗如何解決 - 問(wèn)答 - 億速云 (yisu.com)
https://www.zhihuclub.com/179001.shtml
https://zhuanlan.zhihu.com/p/619203844
到此這篇關(guān)于SpringBoot Seata 死鎖問(wèn)題排查的文章就介紹到這了,更多相關(guān)SpringBoot Seata 死鎖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
SpringMVC使用自定義驗(yàn)證器進(jìn)行數(shù)據(jù)驗(yàn)證的方法
SpringMVC?提供了強(qiáng)大的數(shù)據(jù)驗(yàn)證機(jī)制,可以方便地驗(yàn)證表單提交的數(shù)據(jù),除了自帶的驗(yàn)證器之外,SpringMVC?還支持自定義驗(yàn)證器,允許開(kāi)發(fā)者根據(jù)業(yè)務(wù)需求自定義驗(yàn)證規(guī)則,本文將介紹如何在?SpringMVC?中使用自定義驗(yàn)證器2023-07-07
springcloud nacos的賦值均衡和動(dòng)態(tài)刷新
nacos是一個(gè)分布式的配置中心和注冊(cè)發(fā)現(xiàn)中心,這篇文章主要介紹了springcloud nacos的賦值均衡和動(dòng)態(tài)刷新,需要的朋友可以參考下2024-05-05
springboot如何設(shè)置請(qǐng)求參數(shù)長(zhǎng)度和文件大小限制
這篇文章主要介紹了springboot如何設(shè)置請(qǐng)求參數(shù)長(zhǎng)度和文件大小限制,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-09-09
Java實(shí)現(xiàn)把文件及文件夾壓縮成zip
這篇文章主要介紹了Java實(shí)現(xiàn)把文件及文件夾壓縮成zip,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-03-03
解決SSLContext.getInstance()中參數(shù)設(shè)置TLS版本無(wú)效的問(wèn)題
這篇文章主要介紹了解決SSLContext.getInstance()中參數(shù)設(shè)置TLS版本無(wú)效的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01
Java中的ScheduledThreadPoolExecutor定時(shí)任務(wù)詳解
這篇文章主要介紹了Java中的ScheduledThreadPoolExecutor詳解,??ScheduledThreadPoolExecutor?繼承自?ThreadPoolExecutor,它主要用來(lái)在給定的延遲之后運(yùn)行任務(wù),或者定期執(zhí)行任務(wù),ScheduledThreadPoolExecutor?的功能與?Timer?類(lèi)似<BR>,需要的朋友可以參考下2023-12-12
Windows下后端如何啟動(dòng)SpringBoot的Jar項(xiàng)目
這篇文章主要介紹了Windows下后端如何啟動(dòng)SpringBoot的Jar項(xiàng)目問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-07-07

