springboot2.0+elasticsearch5.5+rabbitmq搭建搜索服務(wù)的坑
前一陣子準(zhǔn)備為項(xiàng)目搭建一個(gè)簡(jiǎn)單的搜索服務(wù),雖然業(yè)務(wù)數(shù)據(jù)庫mongodb提供了文本搜索的支持,但是在大量文檔需要通過關(guān)鍵詞進(jìn)行定位時(shí),es明顯更加適合去作為一個(gè)搜索引擎(雖然我們之前大部分使用到了ELK那套分析和可視化的特性)。Elasticsearch建立在Lucene之上并且支持極其快速的查詢和豐富的查詢語法,偶爾也可以作為一個(gè)輕量級(jí)的NoSQL。但是對(duì)復(fù)雜查詢和聚合操作的能力并不是很強(qiáng)。
本篇不會(huì)提及如何搭建一個(gè)簡(jiǎn)單搜索服務(wù),而是記錄一下大約一周工作時(shí)間內(nèi)遇見的幾個(gè)坑。。
為什么選擇elasticsearch 5.x?
新服務(wù)沒有任何歷史包袱,理論上應(yīng)該用最新的6.x,然而spring-data-elasticsearch只支持到的5.x,時(shí)間緊也無法很好直接封裝一層api,也是因?yàn)镋LK那套東西之前版本混亂,無奈es從2.x直接到了5.x。查詢一下5.x和2.x的差別,簡(jiǎn)單說就是磁盤空間-50%,索引時(shí)間-50%,查詢性能+25%。
由于spring-data-elasticsearch必須升級(jí)到3.0.7,導(dǎo)致spring必須升級(jí)到2.x,也直接導(dǎo)致了后面踩到的坑。
docker安裝es會(huì)默認(rèn)安裝x-path plugin
雖然spring-data支持es5.x,但是功能并不非常完善,因此如果安裝了x-path插件,需要引入org.elasticsearch.client:x-pack-transport:5.5.0,版本必須和es版本一致,并且自己實(shí)現(xiàn)TransportClient,如下
@Component
public class ESconfig {
@Bean
public TransportClient transportClient() throws UnknownHostException {
TransportClient client = new PreBuiltXPackTransportClient(Settings.builder()
.put("cluster.name", "docker-cluster")
.put("xpack.security.user", "elastic:changeme")
.build())
.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("0.0.0.0"), 9300));
return client;
}
}
這也是因?yàn)椴幌朐俚絛ocker里去處理x-path這個(gè)插件而選擇的一個(gè)比較快捷的解決方案,沒必要的情況下,暫時(shí)也不用接觸到es本身的一些東西。
mq會(huì)保存message的class信息導(dǎo)致deserialized失敗
一直沒有提到標(biāo)題中的rabbitmq,因?yàn)橹皇菃渭兊挠盟鳛橐粋€(gè)消息隊(duì)列,當(dāng)數(shù)據(jù)發(fā)生變化時(shí),將消息id丟入mq,由search服務(wù)這邊的consumer去消費(fèi)。
問題就是在消息丟入mq時(shí),封裝成了一個(gè)自己的Object, 導(dǎo)致使用rabbitTemplate.receiveAndConvert時(shí)失敗,因?yàn)閙essage會(huì)帶著Object的package信息。無奈之下,consumer只能直接獲取queue里的message bytes, 用ObjectMapper.readValue的方法將json形式轉(zhuǎn)換成一個(gè)Object。
gradle配置可以使用-Dloader.main指定啟動(dòng)函數(shù)
正是因?yàn)橐肓薽q,所以search服務(wù)需要啟動(dòng)一個(gè)consumer,用的方法是另外實(shí)現(xiàn)一個(gè)不啟動(dòng)Web服務(wù)的Application,并且配置一個(gè)SimpleMessageListenerContainer和MessageListenerAdapter如下:
@Bean
SimpleMessageListenerContainer container(ConnectionFactory connectionFactory,
MessageListenerAdapter listenerAdapter,
MQconfig properties) {
SimpleMessageListenerContainer container = new SimpleMessageListenerContainer();
container.setConnectionFactory(connectionFactory);
container.setQueueNames(properties.getQueueName());
container.setMessageListener(listenerAdapter);
return container;
}
@Bean
MessageListenerAdapter listenerAdapter() {
MessageListenerAdapter listenerAdapter = new MessageListenerAdapter(itemConsumer,
"consume");
return listenerAdapter;
}
問題在于gradle配置的時(shí)候,找了很久如何使得build出來的jar包可以指定-Dloader.main指定啟動(dòng)Application,解決方法如下:
在xxx.gradle文件里添加
bootJar {
manifest {
attributes 'Main-Class': 'org.springframework.boot.loader.PropertiesLauncher'
}
}
在springboot 1.5.9的項(xiàng)目里,需要指定啟動(dòng)Application,需要添加
springBoot{
layout = "ZIP"
}
查看是否生效的辦法是build以后 直接解壓jar包,在xxx(項(xiàng)目名)/META-INFO/MANIFEST.MF里查看,如果
Main-Class: org.springframework.boot.loader.PropertiesLauncher
則正確,如果
Main-Class: org.springframework.boot.loader.JarLauncher
則依舊會(huì)啟動(dòng)文件里的Start-Class
es無法修改Index的mapping
由于只是單純使用了es的文本檢索功能,導(dǎo)致實(shí)際應(yīng)用時(shí)有許多搜索結(jié)果不盡如人意的地方,比如搜索“桌子”, 無法搜索到 “電腦桌/辦公桌”等xx桌內(nèi)容,這樣的情況還有很多。 因此加入了synonym dictionary,在需要分詞的字段上不使用本身的ik_smart分詞器,這樣某些字段的mapping需要改為
// analyzer是自己的分詞器名字 @Field(type = FieldType.Text, index = true, analyzer = "synonym") private String description;
由于es的mapping無法修改,只能通過手動(dòng)創(chuàng)建一個(gè)新的mapping,再通過reIndex方法去backfill數(shù)據(jù)(es5.x自帶了reIndex 的api)。網(wǎng)上有通過alias的方法,在某些修改場(chǎng)景下,不需要重新啟動(dòng)/部署應(yīng)用就可以平滑的修改mapping,具體可以查詢了解一下。
以上差不多搭建一個(gè)搜索服務(wù)踩到的一些坑,有幾個(gè)消耗了大量時(shí)間和精力去解決,在此列出來希望希望有借鑒意義。之后搜索服務(wù)有優(yōu)化的地方,還會(huì)繼續(xù)慢慢更新,也希望大家多多支持腳本之家。
相關(guān)文章
Java+opencv3.2.0實(shí)現(xiàn)模板匹配
這篇文章主要為大家詳細(xì)介紹了Java+opencv3.2.0實(shí)現(xiàn)模板匹配的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-02-02
Springboot POI導(dǎo)出Excel(瀏覽器)
這篇文章主要為大家詳細(xì)介紹了Springboot POI導(dǎo)出Excel,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-05-05
java使用MulticastSocket實(shí)現(xiàn)基于廣播的多人聊天室
這篇文章主要為大家詳細(xì)介紹了java使用MulticastSocket實(shí)現(xiàn)基于廣播的多人聊天室,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-01-01
Java concurrency線程池之Callable和Future_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理
這篇文章主要為大家詳細(xì)介紹了Java concurrency線程池之Callable和Future,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-06-06
基于多網(wǎng)卡環(huán)境下Eureka服務(wù)注冊(cè)IP的選擇問題
這篇文章主要介紹了基于多網(wǎng)卡環(huán)境下Eureka服務(wù)注冊(cè)IP的選擇問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-03-03

