Java中垃圾回收器GC對吞吐量的影響測試
在看內(nèi)存管理術(shù)語表的時(shí)候偶然發(fā)現(xiàn)了”Pig in the Python(注:有點(diǎn)像中文里的貪心不足蛇吞象)”的定義,于是便有了這篇文章。表面上看,這個(gè)術(shù)語說的是GC不停地將大對象從一個(gè)分代提升到另一個(gè)分代的情景。這么做就好比巨蟒整個(gè)吞食掉它的獵物,以至于它在消化的時(shí)候都沒辦法移動(dòng)了。
在接下來的這24個(gè)小時(shí)里我的頭腦中充斥著這個(gè)令人窒息的巨蟒的畫面,揮之不去。正如精神病醫(yī)生所說的,消除恐懼最好的方法就是說出來。于是便有了這篇文章。不過接下的故事我們要講的不是蟒蛇,而是GC的調(diào)優(yōu)。我對天發(fā)誓。
大家都知道GC暫停很容易造成性能瓶頸。現(xiàn)代JVM在發(fā)布的時(shí)候都自帶了高級(jí)的垃圾回收器,不過從我的使用經(jīng)驗(yàn)來看,要找出某個(gè)應(yīng)用最優(yōu)的配置真是難上加難。手動(dòng)調(diào)優(yōu)或許仍有一線希望,但是你得了解GC算法的確切機(jī)制才行。關(guān)于這點(diǎn),本文倒是會(huì)對你有所幫助,下面我會(huì)通過一個(gè)例子來講解JVM配置的一個(gè)小的改動(dòng)是如何影響到你的應(yīng)用程序的吞吐量的。
示例
我們用來演示GC對吞吐量產(chǎn)生影響的應(yīng)用只是一個(gè)簡單的程序。它包含兩個(gè)線程:
PigEater – 它會(huì)模仿巨蟒不停吞食大肥豬的過程。代碼是通過往java.util.List中添加 32MB字節(jié)來實(shí)現(xiàn)這點(diǎn)的,每次吞食完后會(huì)睡眠100ms。
PigDigester – 它模擬異步消化的過程。實(shí)現(xiàn)消化的代碼只是將豬的列表置為空。由于這是個(gè)很累的過程,因此每次清除完引用后這個(gè)線程都會(huì)睡眠2000ms。
兩個(gè)線程都會(huì)在一個(gè)while循環(huán)中運(yùn)行,不停地吃了消化直到蛇吃飽為止。這大概得吃掉5000頭豬。
package eu.plumbr.demo;
public class PigInThePython {
static volatile List pigs = new ArrayList();
static volatile int pigsEaten = 0;
static final int ENOUGH_PIGS = 5000;
public static void main(String[] args) throws InterruptedException {
new PigEater().start();
new PigDigester().start();
}
static class PigEater extends Thread {
@Override
public void run() {
while (true) {
pigs.add(new byte[32 * 1024 * 1024]); //32MB per pig
if (pigsEaten > ENOUGH_PIGS) return;
takeANap(100);
}
}
}
static class PigDigester extends Thread {
@Override
public void run() {
long start = System.currentTimeMillis();
while (true) {
takeANap(2000);
pigsEaten+=pigs.size();
pigs = new ArrayList();
if (pigsEaten > ENOUGH_PIGS) {
System.out.format("Digested %d pigs in %d ms.%n",pigsEaten, System.currentTimeMillis()-start);
return;
}
}
}
}
static void takeANap(int ms) {
try {
Thread.sleep(ms);
} catch (Exception e) {
e.printStackTrace();
}
}
}
現(xiàn)在我們將這個(gè)系統(tǒng)的吞吐量定義為“每秒可以消化的豬的頭數(shù)”??紤]到每100ms就會(huì)有豬被塞到這條蟒蛇里,我們可以看到這個(gè)系統(tǒng)理論上的最大吞吐量可以達(dá)到10頭/秒。
GC配置示例
我們來看下使用兩個(gè)不同的配置系統(tǒng)的表現(xiàn)分別是什么樣的。不管是哪個(gè)配置,應(yīng)用都運(yùn)行在一臺(tái)擁有雙核,8GB內(nèi)存的Mac(OS X10.9.3)上。
第一個(gè)配置:
1.4G的堆(-Xms4g -Xmx4g)
2.使用CMS來清理老年代(-XX:+UseConcMarkSweepGC)使用并行回收器清理新生代(-XX:+UseParNewGC)
3.將堆的12.5%(-Xmn512m)分配給新生代,并將Eden區(qū)和Survivor區(qū)的大小限制為一樣的。
第二個(gè)配置則略有不同:
1.2G的堆(-Xms2g -Xms2g)
2.新生代和老年代都使用Parellel GC(-XX:+UseParallelGC)
3.將堆的75%分配給新生代(-Xmn 1536m)
4.現(xiàn)在是該下注的時(shí)候了,哪個(gè)配置的表現(xiàn)會(huì)更好一些(就是每秒能吃多少豬,還記得吧)?那些把籌碼放到第一個(gè)配置上的家伙,你們一定會(huì)失望的。結(jié)果正好相反:
1.第一個(gè)配置(大堆,大的老年代,CMS GC)每秒能吞食8.2頭豬
2.第二個(gè)配置(小堆,大的新生代,Parellel GC)每秒可以吞食9.2頭豬
現(xiàn)在我們來客觀地看待一下這個(gè)結(jié)果。分配的資源少了2倍但吞吐量提升了12%。這和常識(shí)正好相反,因此有必要進(jìn)一步分析下到底發(fā)生了什么。
分析GC的結(jié)果
原因其實(shí)并不復(fù)雜,你只要仔細(xì)看一下運(yùn)行測試的時(shí)候GC在干什么就能發(fā)現(xiàn)答案了。這個(gè)你可以自己選擇要使用的工具。在jstat的幫助下我發(fā)現(xiàn)了背后的秘密,命令大概是這樣的:
jstat -gc -t -h20 PID 1s
通過分析數(shù)據(jù),我注意到配置1經(jīng)歷了1129次GC周期(YGCT_FGCT),總共花了63.723秒:
Timestamp S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT
594.0 174720.0 174720.0 163844.1 0.0 174848.0 131074.1 3670016.0 2621693.5 21248.0 2580.9 1006 63.182 116 0.236 63.419
595.0 174720.0 174720.0 163842.1 0.0 174848.0 65538.0 3670016.0 3047677.9 21248.0 2580.9 1008 63.310 117 0.236 63.546
596.1 174720.0 174720.0 98308.0 163842.1 174848.0 163844.2 3670016.0 491772.9 21248.0 2580.9 1010 63.354 118 0.240 63.595
597.0 174720.0 174720.0 0.0 163840.1 174848.0 131074.1 3670016.0 688380.1 21248.0 2580.9 1011 63.482 118 0.240 63.723
第二個(gè)配置一共暫停了168次(YGCT+FGCT),只花了11.409秒。
Timestamp S0C S1C S0U S1U EC EU OC OU PC PU YGC YGCT FGC FGCT GCT
539.3 164352.0 164352.0 0.0 0.0 1211904.0 98306.0 524288.0 164352.2 21504.0 2579.2 27 2.969 141 8.441 11.409
540.3 164352.0 164352.0 0.0 0.0 1211904.0 425986.2 524288.0 164352.2 21504.0 2579.2 27 2.969 141 8.441 11.409
541.4 164352.0 164352.0 0.0 0.0 1211904.0 720900.4 524288.0 164352.2 21504.0 2579.2 27 2.969 141 8.441 11.409
542.3 164352.0 164352.0 0.0 0.0 1211904.0 1015812.6 524288.0 164352.2 21504.0 2579.2 27 2.969 141 8.441 11.409
考慮到兩種情況下的工作量是等同的,因此——在這個(gè)吃豬的實(shí)驗(yàn)中當(dāng)GC沒有發(fā)現(xiàn)長期存活的對象時(shí),它能更快地清理掉垃圾對象。而采用第一個(gè)配置的話,GC運(yùn)行的頻率大概會(huì)是6到7倍之多,而總的暫停時(shí)間則是5至6倍。
說這個(gè)故事有兩個(gè)目的。第一個(gè)也是最主要的一個(gè),我希望把這條抽風(fēng)的蟒蛇趕緊從我的腦海里趕出去。另一個(gè)更明顯的收獲就是——GC調(diào)優(yōu)是個(gè)很需要技巧的經(jīng)驗(yàn)活,它需要你對底層的這些概念了如指掌。盡管本文中用到的這個(gè)只是很平常的一個(gè)應(yīng)用,但選擇的不同結(jié)果也會(huì)對你的吞吐量和容量規(guī)劃產(chǎn)生很大的影響。在現(xiàn)實(shí)生活中的應(yīng)用里面,這里的區(qū)別則會(huì)更為巨大。因此,就看你如何抉擇了,你可以去掌握這些概念,或者,只關(guān)注你日常的工作就好了,讓Plumbr來找出你所需要的最合適的GC配置吧。
相關(guān)文章
Javaweb 500 服務(wù)器內(nèi)部錯(cuò)誤的解決
這篇文章主要介紹了Javaweb 500 服務(wù)器內(nèi)部錯(cuò)誤的解決方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-09-09
JDBC以反射機(jī)制加載類注冊驅(qū)動(dòng)連接MySQL
這篇文章介紹了JDBC以反射機(jī)制加載類注冊驅(qū)動(dòng)連接MySQL的方法,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-01-01
Java調(diào)用Python腳本傳遞數(shù)據(jù)并返回計(jì)算結(jié)果
實(shí)際工程項(xiàng)目中可能會(huì)用到Java和python兩種語言結(jié)合進(jìn)行,這樣就會(huì)涉及到一個(gè)問題,Java如何調(diào)用Python腳本,感興趣的可以了解一下2021-05-05
必知必會(huì)的SpringBoot實(shí)現(xiàn)熱部署兩種方式
這篇文章主要為大家介紹了必知必會(huì)的SpringBoot實(shí)現(xiàn)熱部署兩種方式詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-04-04
SpringBoot單點(diǎn)登錄實(shí)現(xiàn)過程詳細(xì)分析
這篇文章主要介紹了SpringBoot單點(diǎn)登錄實(shí)現(xiàn)過程,單點(diǎn)登錄英文全稱Single?Sign?On,簡稱就是SSO。它的解釋是:在多個(gè)應(yīng)用系統(tǒng)中,只需要登錄一次,就可以訪問其他相互信任的應(yīng)用系統(tǒng)2022-12-12
SpringSecurity 自定義認(rèn)證登錄的項(xiàng)目實(shí)踐
本文主要介紹了SpringSecurity 自定義認(rèn)證登錄的項(xiàng)目實(shí)踐,以手機(jī)驗(yàn)證碼登錄為例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2024-08-08
Struts2動(dòng)態(tài)結(jié)果集代碼示例
這篇文章主要介紹了Struts2動(dòng)態(tài)結(jié)果集的有關(guān)內(nèi)容,涉及具體代碼示例,具有一定參考價(jià)值,需要的朋友可以了解下。2017-09-09
Session過期后自動(dòng)跳轉(zhuǎn)到登錄頁面的實(shí)例代碼
這篇文章主要介紹了Session過期后自動(dòng)跳轉(zhuǎn)到登錄頁面實(shí)例代碼,非常不錯(cuò)具有參考借鑒價(jià)值,需要的朋友可以參考下2016-06-06
Quarkus中實(shí)現(xiàn)Resteasy的文件上傳下載操作
這篇文章主要為大家介紹了Quarkus中實(shí)現(xiàn)Resteasy的文件上傳下載的操作過程步驟,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2022-02-02

