Java8 如何正確高效的使用并行流
正確使用并行流,避免共享可變狀態(tài)
錯(cuò)用并行流而產(chǎn)生錯(cuò)誤的首要原因,就是使用的算法改變了某些共享狀態(tài)。下面是另一種實(shí)現(xiàn)對(duì)前n個(gè)自然數(shù)求和的方法,但這會(huì)改變一個(gè)共享累加器:
public static long sideEffectSum(long n) {
Accumulator accumulator = new Accumulator();
LongStream.rangeClosed(1, n).forEach(accumulator::add);
return accumulator.total;
}
public class Accumulator {
public long total = 0;
public void add(long value) { total += value; }
}
有什么問(wèn)題呢?
它在本質(zhì)上就是順序的。每次訪問(wèn) total 都會(huì)出現(xiàn)數(shù)據(jù)競(jìng)爭(zhēng)。如果用同步來(lái)修復(fù),那就完全失去并行的意義了。
為了說(shuō)明這一點(diǎn),讓我們?cè)囍?Stream 變成并行的:
public static long sideEffectParallelSum(long n) {
Accumulator accumulator = new Accumulator();
LongStream.rangeClosed(1, n).parallel().forEach(accumulator::add);
return accumulator.total;
}
測(cè)試下,輸出


性能無(wú)關(guān)緊要了,唯一要緊的是每次執(zhí)行都會(huì)返回不同的結(jié)果,都離正確值差很遠(yuǎn)。這是由于多個(gè)線程在同時(shí)訪問(wèn)累加器,執(zhí)行 total += value ,而這卻不是一個(gè)原子操作。問(wèn)題的根源在于, forEach 中調(diào)用的方法有副作用它會(huì)改變多個(gè)線程共享的對(duì)象的可變狀態(tài)。
要是你想用并行 Stream 又不想引發(fā)類(lèi)似的意外,就必須避免這種情況。
所以共享可變狀態(tài)會(huì)影響并行流以及并行計(jì)算,要避免共享可變狀態(tài),確保并行 Stream 得到正確的結(jié)果。
高效使用并行流
是否有必要使用并行流?
- 如果有疑問(wèn),多次測(cè)試結(jié)果。把順序流轉(zhuǎn)成并行流輕而易舉,但卻不一定是好事
- 留意裝箱。自動(dòng)裝箱和拆箱操作會(huì)大大降低性能
Java 8中有原始類(lèi)型流( IntStream 、LongStream 、 DoubleStream )來(lái)避免這種操作,但?有可能都應(yīng)該用這些流。
- 有些操作本身在并行流上的性能就比順序流差。特別是 limit 和 findFirst 等依賴(lài)于元素順序的操作,它們?cè)诓⑿辛魃蠄?zhí)行的代價(jià)非常大。
例如, findAny 會(huì)比 findFirst 性能好,因?yàn)樗灰欢ㄒ错樞騺?lái)執(zhí)行。可以調(diào)用 unordered 方法來(lái)把有序流變成無(wú)序流。那么,如果你需要流中的n個(gè)元素而不是專(zhuān)門(mén)要前n個(gè)的話,對(duì)無(wú)序并行流調(diào)用limit 可能會(huì)比單個(gè)有序流(比如數(shù)據(jù)源是一個(gè) List )更高效。
- 還要考慮流的操作流水線的總計(jì)算成本。
設(shè)N是要處理的元素的總數(shù),Q是一個(gè)元素通過(guò)流水線的大致處理成本,則N*Q就是這個(gè)對(duì)成本的一個(gè)粗略的定性估計(jì)。Q值較高就意味著使用并行流時(shí)性能好的可能性比較大。
- 對(duì)于較小的數(shù)據(jù)量,選擇并行流幾乎從來(lái)都不是一個(gè)好的決定。并行處理少數(shù)幾個(gè)元素的好處還?不上并行化造成的額外開(kāi)銷(xiāo)
- 要考慮流背后的數(shù)據(jù)結(jié)構(gòu)是否易于分解。
例如, ArrayList 的拆分效率比 LinkedList高得多,因?yàn)榍罢哂貌恢闅v就可以平均拆分,而后者則必須遍歷。另外,用 range 工廠方法創(chuàng)建的原始類(lèi)型流也可以快速分解。
- 流自身的特點(diǎn),以及流水線中的中間操作修改流的方式,都可能會(huì)改變分解過(guò)程的性能。
例如,一個(gè) SIZED 流可以分成大小相等的兩部分,這樣每個(gè)部分都可以比較高效地并行處理,但篩選操作可能丟棄的元素個(gè)數(shù)卻無(wú)法預(yù)測(cè),導(dǎo)致流本身的大小未知。
- 還要考慮終端操作中合并步驟的代價(jià)是大是?。ɡ?Collector 中的 combiner 方法)
如果這一步代價(jià)很大,那么組合每個(gè)子流產(chǎn)生的部分結(jié)果所付出的代價(jià)就可能會(huì)超出通過(guò)并行流得到的性能提升。
流的數(shù)據(jù)源和可分解性

最后, 并行流背后使用的基礎(chǔ)架構(gòu)是Java 7中引入的分支/合并框架了解它的內(nèi)部原理至關(guān)重要。
java 并行計(jì)算的幾點(diǎn)實(shí)踐總結(jié)
稍微接觸了 java 的并行計(jì)算,談?wù)剮c(diǎn)淺顯的總結(jié)吧
并行計(jì)算不一定比串行計(jì)算快,一般在大規(guī)模問(wèn)題才會(huì)顯示出優(yōu)勢(shì)
結(jié)合 lambda 表達(dá)式的 parallelStream 可以方便調(diào)用并行計(jì)算,但可能會(huì)出現(xiàn)空指針錯(cuò)誤,解決這一問(wèn)題可能需要更高級(jí)的多線程知識(shí)
看網(wǎng)上資料,Collection 類(lèi)型對(duì)并行計(jì)算支持的好,一般數(shù)組類(lèi)型支持的一般。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
JAVA用遞歸實(shí)現(xiàn)全排列算法的示例代碼
這篇文章主要介紹了JAVA用遞歸實(shí)現(xiàn)全排列算法的相關(guān)資料,文中示例代碼非常詳細(xì),幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下2020-07-07
詳解SpringBoot開(kāi)發(fā)案例之整合定時(shí)任務(wù)(Scheduled)
本篇文章主要介紹了詳解SpringBoot開(kāi)發(fā)案例之整合定時(shí)任務(wù)(Scheduled),具有一定的參考價(jià)值,有興趣的可以了解一下2017-07-07
SpringBoot中MockMVC單元測(cè)試的實(shí)現(xiàn)
Mock是一種用于模擬和替換類(lèi)的對(duì)象的方法,以便在單元測(cè)試中獨(dú)立于外部資源進(jìn)行測(cè)試,本文主要介紹了SpringBoot中MockMVC單元測(cè)試的實(shí)現(xiàn),具有應(yīng)該的參考價(jià)值,感興趣的可以了解一下2024-02-02
使用SpringBoot整合Activiti6工作流的操作方法
這篇文章主要介紹了使用SpringBoot整合Activiti6工作流,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-07-07
記一次集成swagger2(Knife4j)在線文檔提示:Knude4j文檔請(qǐng)求異常的解決辦法
Knife4j是一個(gè)集Swagger2 和 OpenAPI3為一體的增強(qiáng)解決方案,下面這篇文章主要給大家介紹了關(guān)于一次集成swagger2(Knife4j)在線文檔提示:Knude4j文檔請(qǐng)求異常的解決辦法,文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下2024-02-02
Spring Cloud Gateway組件的三種使用方式實(shí)例詳解
Spring Cloud Gateway是 Spring 官方基于 Spring5.0 、 SpringBoot2.0 和 Project Reactor 等技術(shù)開(kāi)發(fā)的網(wǎng)關(guān)旨在為微服務(wù)框架提供一種簡(jiǎn)單而有效的統(tǒng)一的API 路由管理方式,統(tǒng)一訪問(wèn)接口,這篇文章主要介紹了Spring Cloud Gateway組件的三種使用方式,需要的朋友可以參考下2024-01-01
淺談Java如何實(shí)現(xiàn)一個(gè)基于LRU時(shí)間復(fù)雜度為O(1)的緩存
這篇文章主要介紹了淺談Java如何實(shí)現(xiàn)一個(gè)基于LRU時(shí)間復(fù)雜度為O(1)的緩存,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08

