搜索歷史基本原理實(shí)現(xiàn)即時(shí)自動(dòng)補(bǔ)全聯(lián)想搜索技巧
實(shí)現(xiàn)搜索歷史-[即時(shí)自動(dòng)補(bǔ)全&聯(lián)想搜索]
無論是新聞、內(nèi)容、還是電商平臺(tái),聯(lián)想輸入已經(jīng)成為搜索功能的標(biāo)配,早已不是什么新鮮事物。我們隨便打開一個(gè)搜索引擎或者是電商平臺(tái),當(dāng)我們在輸入框輸入拼音或者文字時(shí)就會(huì)看到輸入框下方彈出有意義的搜索建議,提示我們是不是想要輸入“以下”內(nèi)容,幫助我們補(bǔ)齊輸入或是修正錯(cuò)誤的輸入,優(yōu)化我們的搜索體驗(yàn)。

在上圖示例中,我們可以看到,輸入關(guān)鍵字 聯(lián)想搜索,Google 搜索會(huì)聯(lián)想到聯(lián)想搜索、elasticsearch聯(lián)想搜索,好處就是,我們無須輸入完整的關(guān)鍵字即可輕松完成針對(duì)這些 topics 的搜索。
今天我們實(shí)現(xiàn)的功能和聯(lián)想搜索有一點(diǎn)差別,我們是根據(jù)用戶隔離,基于個(gè)人搜索歷史的聯(lián)想搜索。
如何實(shí)現(xiàn)基于個(gè)人搜索歷史的聯(lián)想推薦
一個(gè)好的自動(dòng)補(bǔ)全器必須是快速的,并且在用戶鍵入下一個(gè)字符后立即更新聯(lián)想詞列表。自動(dòng)補(bǔ)全器的核心是一個(gè)函數(shù),它接受輸入的前綴,并搜索以給定前綴開頭的詞匯或語句列表。通常來說,只需要返回少量的數(shù)目即可。
架構(gòu)圖

詞匯表實(shí)現(xiàn)
實(shí)現(xiàn)方式有很多種,例如前綴樹實(shí)現(xiàn),有限狀態(tài)自動(dòng)機(jī)(DFA)實(shí)現(xiàn)等等。
這里采用Redis ZSET數(shù)據(jù)結(jié)構(gòu)快速實(shí)現(xiàn)。
- Redis 有序集合和集合一樣也是 string 類型元素的集合,且不允許重復(fù)的成員。
- 不同的是每個(gè)元素都會(huì)關(guān)聯(lián)一個(gè) double 類型的分?jǐn)?shù)。redis 正是通過分?jǐn)?shù)來為集合中的成員進(jìn)行從小到大的排序。
type zset key search-history-common key search-history-user:1 key search-history-user:2 key search-history-user:3


備注:
- 常用搜索詞庫數(shù)據(jù)統(tǒng)計(jì)規(guī)則:定時(shí)取出所有人詞庫中排名靠前n位的搜索項(xiàng)并放入常用搜索庫中
- 分?jǐn)?shù)值 = 原有分?jǐn)?shù)值*1.01+1.01 (為什么用一元函數(shù),因?yàn)榭梢宰尦S迷~和不常用詞更快的區(qū)分開)
- 分?jǐn)?shù)值初始值為 1
實(shí)現(xiàn)原理
新增關(guān)鍵字操作
- 直接添加 默認(rèn)score = 1
- 添加失敗查詢score
- 設(shè)置新score = score*1.1+1.1 (注意zset不能重新設(shè)置score
- 緩存完成

# 計(jì)算新score # 新score應(yīng)該 = score*1.1+1.1 但是 需要用ZADD,所以需要換算,(score*1.1+1.1)-score = a ZADD key a member # 化簡得到 ZADD key score*0.1+1.1 member
# 添加 member = 1 返回 score # 如果存在則添加失敗 返回 0 ZADD key 1 member # 獲取分,不存在返回 null ZSCORE key member # 對(duì)某個(gè)鍵加上增量 ZADD key 1 member
刪除關(guān)鍵字操作
- 直接刪除
# 刪除成功返回 1,如果一個(gè)zset下沒有item, zset也會(huì)被自動(dòng)刪除 ZREM key member
查詢推薦列表操作
- 全量查詢當(dāng)前用戶詞匯表
- 使用String.contains 或者其他框架過濾出推薦詞
- 返回推薦列表到前端

# 全量查詢 zset key(從小到大) ZRANGE key 0 -1 member2 member # 全量查詢 zset key(從大到?。? ZRANGE key 0 -1 WITHSCORES member2 2 member 6
以上就是搜索歷史基本原理實(shí)現(xiàn)即時(shí)自動(dòng)補(bǔ)全聯(lián)想搜索技巧的詳細(xì)內(nèi)容,更多關(guān)于搜索歷史自動(dòng)補(bǔ)全聯(lián)想搜索的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
git分支(branch)操作相關(guān)命令及分支命令的使用
這篇文章主要介紹了git分支(branch)操作相關(guān)命令及分支命令的使用的相關(guān)資料,需要的朋友可以參考下2017-10-10
win10+RTX3050ti+TensorFlow+cudn+cudnn配置深度學(xué)習(xí)環(huán)境的方法
這篇文章主要介紹了win10+RTX3050ti+TensorFlow+cudn+cudnn配置深度學(xué)習(xí)環(huán)境,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2022-06-06
淺談IDEA Scratch files萬能的臨時(shí)文件功能
這篇文章主要介紹了淺談IDEA Scratch files萬能的臨時(shí)文件功能,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-05-05
使用git?config?--global設(shè)置用戶名和郵件問題
這篇文章主要介紹了使用git?config?--global設(shè)置用戶名和郵件問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-05-05
Postman設(shè)置環(huán)境變量的實(shí)現(xiàn)示例
本文主要介紹了Postman設(shè)置環(huán)境變量的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-02-02

