Redis實現布隆過濾器緩存去重的"智能門衛(wèi)"(實例詳解)

更新時間：2026年02月02日 08:47:43 作者：佛祖讓我來巡山

布隆過濾器（Bloom Filter）本質是一個基于哈希函數的概率型數據結構,核心作用是快速判斷一個元素是否存在于集合中,今天給大家介紹Redis實現布隆過濾器緩存去重的"智能門衛(wèi)",感興趣的朋友跟隨小編一起看看吧

在緩存架構中，總有一些“頭疼問題”：用戶反復提交相同請求、查詢不存在的key導致緩存穿透、海量數據去重效率低下……這些場景下，Redis布隆過濾器就是當之無愧的“救星”。它像一個智能門衛(wèi)，能快速判斷“這個人是不是來過”“這個key是不是不存在”，用極小的空間成本實現高效過濾，性能遠超傳統(tǒng)的數據庫查詢或全量緩存校驗。

今天咱們就從“是什么、為什么好用、怎么用Redis快速實現”三個維度，用通俗的語言+實操代碼，把布隆過濾器講透。全程避開復雜公式，就算是剛接觸緩存的同學，也能跟著步驟快速落地。

一、先搞懂：布隆過濾器到底是個啥？

布隆過濾器（Bloom Filter）本質是一個基于哈希函數的概率型數據結構，核心作用是“快速判斷一個元素是否存在于集合中”。它不像哈希表那樣存儲完整數據，而是用一個二進制數組（bit數組）+多個哈希函數，通過標記元素的哈希位置來實現過濾。

咱們用“小區(qū)門衛(wèi)記訪客”的場景類比，秒懂核心邏輯：

二進制數組 = 門衛(wèi)的登記本，每一頁只有“是”（1）和“否”（0）兩個狀態(tài)；
哈希函數 = 門衛(wèi)的“記憶規(guī)則”，比如“記住訪客的姓氏首字母+身高區(qū)間+鞋子顏色”；
元素存在判斷 = 門衛(wèi)根據記憶規(guī)則核對登記本，只要有一條規(guī)則對應“否”，就確定訪客沒來過；如果全是“是”，則大概率來過（存在極小誤判）。

核心特性：優(yōu)點與“小瑕疵”

布隆過濾器的優(yōu)勢和局限性都很鮮明，落地前必須摸清：

? 核心優(yōu)點

空間占用極?。簝H用bit數組存儲標記，存儲100萬條數據，誤判率1%時，僅需約1.2MB空間；
查詢速度極快：時間復雜度是O(k)（k是哈希函數個數），無論數據量多大，都能瞬間返回結果；
支持海量數據：無需存儲完整數據，可輕松應對千萬級、億級數據的過濾場景。

? 不可忽視的局限性

存在誤判率：只能確定“元素一定不存在”，不能100%確定“元素一定存在”，誤判率可通過參數調整，但無法完全消除；
不支持刪除操作：一旦元素被標記到bit數組，無法反向清除（會影響其他元素的判斷）；
需提前預估數據量：哈希函數個數、bit數組長度需根據預估數據量計算，否則會導致誤判率飆升。

二、Redis實現布隆過濾器的兩種方式

Redis本身沒有內置布隆過濾器，但提供了兩種快速實現的方案：一是基于Redis的BitMap（位圖）手動實現，靈活可控；二是使用Redis官方推薦的Redisson客戶端，封裝好現成API，開箱即用。咱們分別講實操，按需選擇即可。

方案一：基于BitMap手動實現（靈活可控）

核心思路：利用Redis的BitMap數據結構作為布隆過濾器的bit數組，通過多個哈希函數計算元素的哈希值，將對應位置的bit置為1；查詢時，同樣計算哈希值，檢查所有位置是否為1，全為1則大概率存在，否則一定不存在。

1. 關鍵參數計算（避免誤判率過高）

手動實現前，需先確定三個核心參數，可通過公式或在線工具計算：

m：bit數組長度（單位：bit），預估數據量n越大，m需越大；
k：哈希函數個數，k過多會導致bit數組快速被占滿，誤判率上升；k過少則過濾效果差；
p：可接受的誤判率（通常設為0.01~0.1）。

常用計算公式（無需死記，在線工具直接算）：

m = - (n * ln p) / (ln 2)² （bit數組長度）；
k = (m / n) * ln 2 （哈希函數個數）。

舉個例子：預估存儲10萬條數據，誤判率設為0.01，計算得m≈958505 bit（約117KB），k≈7個哈希函數。

2. 手動實現代碼（Java示例）

核心是實現多個哈希函數，操作Redis的BitMap指令（SETBIT置1，GETBIT查詢）：

import org.springframework.data.redis.core.StringRedisTemplate;
import java.nio.charset.StandardCharsets;
import java.security.MessageDigest;
import java.security.NoSuchAlgorithmException;
/**
 * 基于Redis BitMap手動實現布隆過濾器
 */
public class RedisBloomFilter {
    // Redis鍵名
    private final String key;
    // bit數組長度
    private final long bitSize;
    // 哈希函數個數
    private final int hashCount;
    private final StringRedisTemplate stringRedisTemplate;
    // 構造器：初始化參數
    public RedisBloomFilter(String key, long n, double p, StringRedisTemplate stringRedisTemplate) {
        this.key = key;
        this.stringRedisTemplate = stringRedisTemplate;
        // 計算bit數組長度
        this.bitSize = (long) (-n * Math.log(p) / (Math.log(2) * Math.log(2)));
        // 計算哈希函數個數
        this.hashCount = (int) (this.bitSize / n * Math.log(2));
    }
    // 添加元素到布隆過濾器
    public void add(Object value) {
        byte[] bytes = value.toString().getBytes(StandardCharsets.UTF_8);
        long[] hashes = hash(bytes, hashCount, bitSize);
        for (long hash : hashes) {
            // 把對應bit位置置為1
            stringRedisTemplate.opsForValue().setBit(key, hash, true);
        }
    }
    // 判斷元素是否存在（存在返回true，不存在返回false；true可能是誤判）
    public boolean contains(Object value) {
        byte[] bytes = value.toString().getBytes(StandardCharsets.UTF_8);
        long[] hashes = hash(bytes, hashCount, bitSize);
        for (long hash : hashes) {
            // 只要有一個bit位為0，就確定不存在
            if (!stringRedisTemplate.opsForValue().getBit(key, hash)) {
                return false;
            }
        }
        return true;
    }
    // 多哈希函數實現（基于MD5拆分）
    private long[] hash(byte[] bytes, int hashCount, long bitSize) {
        long[] hashes = new long[hashCount];
        try {
            MessageDigest md5 = MessageDigest.getInstance("MD5");
            byte[] digest = md5.digest(bytes);
            // 把MD5結果（16字節(jié)）拆分成多個哈希值
            for (int i = 0; i < hashCount; i++) {
                long hash = 0;
                for (int j = i * 2; j < (i + 1) * 2 && j < digest.length; j++) {
                    hash = hash * 256 + (digest[j] & 0xFF);
                }
                // 確保哈希值在bit數組長度范圍內
                hashes[i] = hash % bitSize;
            }
        } catch (NoSuchAlgorithmException e) {
            throw new RuntimeException("哈希函數初始化失敗", e);
        }
        return hashes;
    }
}

3. 使用方式

// 初始化布隆過濾器：key為"user:bloom:filter"，預估10萬條數據，誤判率0.01
RedisBloomFilter bloomFilter = new RedisBloomFilter("user:bloom:filter", 100000, 0.01, stringRedisTemplate);
// 添加元素
bloomFilter.add("user123");
bloomFilter.add("order456");
// 判斷元素是否存在
boolean exists = bloomFilter.contains("user123"); // 大概率返回true
boolean notExists = bloomFilter.contains("user789"); // 一定返回false

方案二：Redisson客戶端實現（開箱即用）

如果覺得手動實現麻煩，推薦用Redisson——Redis官方生態(tài)的Java客戶端，已經封裝好了布隆過濾器，支持自動計算參數、分布式場景，還解決了手動實現的哈希函數優(yōu)化問題，生產環(huán)境首選。

1. 引入依賴

<dependency>
    <groupId>org.redisson</groupId>
    <artifactId>redisson-spring-boot-starter</artifactId>
    <version>3.23.3</version> // 版本與Redis版本適配
</dependency>

2. 快速實現代碼

import org.redisson.api.RBloomFilter;
import org.redisson.api.RedissonClient;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Component;
@Component
public class RedissonBloomFilterDemo {
    @Autowired
    private RedissonClient redissonClient;
    // 初始化布隆過濾器
    public RBloomFilter<String> initBloomFilter() {
        // 布隆過濾器名稱
        String filterName = "user:bloom:filter:redisson";
        // 獲取布隆過濾器實例
        RBloomFilter<String> bloomFilter = redissonClient.getBloomFilter(filterName);
        // 初始化：預估10萬條數據，誤判率0.01（Redisson會自動計算m和k）
        bloomFilter.tryInit(100000, 0.01);
        return bloomFilter;
    }
    // 測試使用
    public void testBloomFilter() {
        RBloomFilter<String> bloomFilter = initBloomFilter();
        // 添加元素
        bloomFilter.add("user123");
        bloomFilter.add("order456");
        // 判斷元素是否存在
        boolean exists = bloomFilter.contains("user123"); // 大概率true
        boolean notExists = bloomFilter.contains("user789"); // 一定false
        // 統(tǒng)計已添加元素數量（近似值）
        long count = bloomFilter.count();
        System.out.println("已添加元素數量：" + count);
    }
}

3. 核心優(yōu)勢

分布式支持：適配微服務場景，多實例共享同一個布隆過濾器，無需擔心數據一致性；
參數優(yōu)化：內置更高效的哈希函數（MurmurHash），誤判率控制更精準；
API豐富：支持元素計數、批量添加等功能，比手動實現更完善。

三、實際應用場景與避坑指南

? 典型應用場景

緩存穿透防護：查詢數據庫前，先用布隆過濾器判斷key是否存在，不存在則直接返回，避免大量無效數據庫查詢；
海量數據去重：比如用戶簽到、日志去重、爬蟲URL去重，無需存儲全量數據，僅用bit數組標記；
防止重復提交：接口請求前，用布隆過濾器判斷請求ID是否已處理，避免重復業(yè)務邏輯執(zhí)行；
黑名單過濾：比如垃圾郵件識別、惡意IP攔截，快速判斷是否在黑名單中。

? 避坑指南

不要用在“絕對不能誤判”的場景：比如金融交易、用戶登錄驗證，誤判可能導致嚴重問題；
提前預估數據量：若實際數據量遠超預估，bit數組會被快速占滿，誤判率會急劇上升，可預留2~3倍冗余；
定期重置布隆過濾器：若數據有過期特性（比如每日黑名單更新），可定期刪除舊的布隆過濾器，重建新實例；
Redis集群注意事項：手動實現的布隆過濾器若用在Redis集群中，需確保key落在同一個節(jié)點（避免哈希分片導致bit數組分散），Redisson已自動處理該問題。

四、總結：什么時候選哪種實現方式？

Redis布隆過濾器的核心價值的是“用極小空間換極高過濾效率”，落地時按場景選擇實現方式：

快速落地、生產環(huán)境、分布式場景：選Redisson，省心高效，適配性強；
學習研究、自定義哈希函數、特殊參數需求：選手動實現，靈活可控，加深對原理的理解。

其實布隆過濾器的邏輯并不復雜，核心就是“哈希標記+概率判斷”。掌握它之后，面對緩存穿透、海量去重等問題，就不用再靠“全量存儲”這種笨辦法，能大幅提升系統(tǒng)性能和空間利用率。下次再遇到類似場景，直接掏出Redis布隆過濾器，輕松搞定！

到此這篇關于Redis快速實現布隆過濾器：緩存去重的“智能門衛(wèi)”的文章就介紹到這了,更多相關Redis布隆過濾器內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Redis increment 函數處理并發(fā)序列號案例
這篇文章主要介紹了Redis increment 函數處理并發(fā)序列號案例,本文通過實例代碼給大家介紹的非常詳細,感興趣的朋友跟隨小編一起看看吧
2024-08-08
Redis中List類型的常用命令
本文主要介紹了Redis中List類型的常用命令,包含12種常用命令,具有一定的參考價值,感興趣的可以了解一下
2024-06-06
redis使用不當導致應用卡死bug的過程解析
本文主要記一次找因redis使用不當導致應用卡死bug的過程，文中通過示例代碼介紹的非常詳細，需要的朋友們下面隨著小編來一起學習學習吧
2021-07-07
linux安裝配置及使用redis
本文主要跟大家講解的是在Linux環(huán)境下，Redis的安裝與部署，非常的簡單實用，有需要的小伙伴可以參考下
2018-04-04
Redis 中spark參數executor-cores引起的異常解決辦法
這篇文章主要介紹了Redis 中spark參數executor-cores引起的異常解決辦法的相關資料,需要的朋友可以參考下
2017-03-03
redis主從連接不成功錯誤問題及解決
這篇文章主要介紹了redis主從連接不成功錯誤問題及解決方案,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教<BR>
2024-01-01
Redis集群節(jié)點通信過程/原理流程分析
這篇文章主要介紹了Redis集群節(jié)點通信過程/原理,詳細介紹了Cluster（集群）的節(jié)點通信的流程，本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2022-03-03
redis?zrange?與?zrangebyscore的區(qū)別解析
這篇文章主要介紹了redis?zrange與zrangebyscore的區(qū)別,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下
2023-06-06
Linux下Redis安裝使用教程
這篇文章主要為大家詳細介紹了Linux下Redis安裝使用教程，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-09-09
關于redigo中PubSub的一點小坑分析
這篇文章主要給大家介紹了關于redigo中PubSub的一點小坑的相關資料，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-01-01

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Redis實現布隆過濾器緩存去重的"智能門衛(wèi)"(實例詳解)

目錄

一、先搞懂：布隆過濾器到底是個啥？

核心特性：優(yōu)點與“小瑕疵”

? 核心優(yōu)點

? 不可忽視的局限性

二、Redis實現布隆過濾器的兩種方式

方案一：基于BitMap手動實現（靈活可控）

1. 關鍵參數計算（避免誤判率過高）

2. 手動實現代碼（Java示例）

3. 使用方式

方案二：Redisson客戶端實現（開箱即用）

1. 引入依賴

2. 快速實現代碼

3. 核心優(yōu)勢

三、實際應用場景與避坑指南

? 典型應用場景

? 避坑指南

四、總結：什么時候選哪種實現方式？

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线 免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Redis實現布隆過濾器緩存去重的"智能門衛(wèi)"(實例詳解)

目錄

一、先搞懂：布隆過濾器到底是個啥？

核心特性：優(yōu)點與“小瑕疵”

? 核心優(yōu)點

? 不可忽視的局限性

二、Redis實現布隆過濾器的兩種方式

方案一：基于BitMap手動實現（靈活可控）

1. 關鍵參數計算（避免誤判率過高）

2. 手動實現代碼（Java示例）

3. 使用方式

方案二：Redisson客戶端實現（開箱即用）

1. 引入依賴

2. 快速實現代碼

3. 核心優(yōu)勢

三、實際應用場景與避坑指南

? 典型應用場景

? 避坑指南

四、總結：什么時候選哪種實現方式？

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

一、先搞懂：布隆過濾器到底是個啥？

二、Redis實現布隆過濾器的兩種方式

三、實際應用場景與避坑指南

四、總結：什么時候選哪種實現方式？