MongoDB中如何使用JOIN操作詳解
前言
MongoDB是由C++語言所編寫的一種面向文檔的非關(guān)系型數(shù)據(jù)庫(是一種NoSql數(shù)據(jù)庫實(shí)現(xiàn)),也是介于關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)存儲(chǔ)產(chǎn)品,而眾所周知SQL與NoSQL最大的不同之一就是不支持JOIN,在傳統(tǒng)的數(shù)據(jù)庫中,SQL JOIN子句允許你使用普通的字段,在兩個(gè)或者是更多表中的組合表中的每行數(shù)據(jù)。例如,如果你有表books和publishers,你可以像下面這樣寫命令:
SELECT book.title, publisher.name FROM book LEFT JOIN book.publisher_id ON publisher.id;
換句話說,book表中的publisher_id字段引用了publishers表中的id字典。這些都是很常見的例子:對(duì)于每個(gè)publisher都可以擁有成千上萬本書,如果你想更新publisher的信息的時(shí)候,我們只需要更改一條記錄。數(shù)據(jù)的冗余是很小的,因?yàn)槲覀儾恍枰獮槊勘緯鴣碇貜?fù)更新他的publisher信息,這種技術(shù)已基本當(dāng)做一種規(guī)范化的東西了。SQL數(shù)據(jù)庫提供了一些列的規(guī)范與約束條件來保障數(shù)據(jù)關(guān)聯(lián)性。
--------------------------------------------------------------------------------
NoSQL == No JOIN?
并不都是這樣吧。。。。。
--------------------------------------------------------------------------------
面向文檔的數(shù)據(jù)庫,例如MongoDB,被設(shè)計(jì)用來存儲(chǔ)非結(jié)構(gòu)化的數(shù)據(jù),理想情況下,這些數(shù)據(jù)是在數(shù)據(jù)集合中是相互沒有關(guān)聯(lián)的,如果一條數(shù)據(jù)包含兩次或者更多次,那數(shù)據(jù)就重復(fù)了。因?yàn)榇蟛糠智闆r下我們還是需要數(shù)據(jù)關(guān)聯(lián)的,只有很少的情況下才會(huì)不需要關(guān)聯(lián)數(shù)據(jù),看來NoSQL這些特性看來讓人失望啊。幸運(yùn)的是MongoDB 3.2 介紹了一個(gè)新的$lookup操作,這個(gè)操作可以提供一個(gè)類似于LEFT OUTER JOIN的操作在兩個(gè)或者是更多的條件下。
--------------------------------------------------------------------------------
MongoDB Aggregation
$lookup僅僅在 aggregation操作中才被允許使用,想想他作為一個(gè)管道操作:查詢,過濾,組合結(jié)果。一個(gè)操作的輸出被作為下一個(gè)的輸入。Aggregation比簡(jiǎn)單的查詢操作更難于理解,而且這些操作通常運(yùn)行很慢,然而他們很高效,Aggregation可以使用一個(gè)很好的例子來解釋,假設(shè)我們使用user數(shù)據(jù)集合來創(chuàng)建一個(gè)社交平臺(tái),在每個(gè)獨(dú)立的文檔中存儲(chǔ)沒個(gè)用戶的信息,例如:
{
"_id": ObjectID("45b83bda421238c76f5c1969"),
"name": "User One",
"email: "userone@email.com",
"country": "UK",
"dob": ISODate("1999-09-13T00:00:00.000Z")
}
我們可以向user這個(gè)集合中添加足夠多的用戶,但是每個(gè)MongoDB文檔都必須有一個(gè)為一個(gè)_id字段值,這個(gè)_id字段值就像SQL中的鍵,在我們沒有明確指定_id的時(shí)候會(huì)被自動(dòng)的加入到文檔中。我們的社交網(wǎng)站現(xiàn)在需要一個(gè)post集合,這個(gè)結(jié)合存儲(chǔ)用戶的評(píng)論,這個(gè)文檔存儲(chǔ)純文本,時(shí)間,評(píng)分,一個(gè)被寫到user_id字段的玩家引用。
{
"_id": ObjectID("17c9812acff9ac0bba018cc1"),
"user_id": ObjectID("45b83bda421238c76f5c1969"),
"date: ISODate("2016-09-05T03:05:00.123Z"),
"text": "My life story so far",
"rating": "important"
}
我們現(xiàn)在想要顯示最近具有important評(píng)論的二十條數(shù)據(jù),這些數(shù)據(jù)來自所有的用戶,并且是按照時(shí)間排序的。每一個(gè)返回的文檔中應(yīng)該包含評(píng)論的文本,發(fā)布評(píng)論的時(shí)間,以及相關(guān)的用戶的名字和國家。
MongoDB數(shù)據(jù)庫的aggregate查詢是通過傳遞管道操作的數(shù)組,這個(gè)數(shù)組中順序的定了每個(gè)操作。首先,我們需要從所有的post集合中提取出所有的文檔,這些文檔使用$match記性準(zhǔn)確rating過濾。
{ "$match": { "rating": "important" } }
我們現(xiàn)在需要對(duì)過濾出來的文檔按照時(shí)間,使用$sort操作進(jìn)行排序。
{ "$sort": { "date": -1 } }
因?yàn)槲覀円獌H僅返回二十條數(shù)據(jù),我們可以使用$limit來限制我們需要處理的文檔數(shù)量。
{ "$limit": 20 }
我們現(xiàn)在使用$lookup操作從user集合中連接數(shù)據(jù),這個(gè)操作需要一個(gè)四個(gè)參數(shù)的對(duì)象:
1、localField:在輸入文檔中的查找字段
2、from:需要連接的集合
3、foreignField:需要在from集合中查找的字段
4、as:輸出的字段名字
所以我們的操作是這樣的:
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} }
在我們的輸出中將會(huì)創(chuàng)建一個(gè)名為userinfo的新字段,他是一個(gè)數(shù)組,其中每個(gè)元素都是在user集合中匹配的元素。
"userinfo": [
{ "name": "User One", ... }
]
在post.user_id與user._id之間,我們具有一對(duì)一的關(guān)系,因?yàn)閷?duì)于每一個(gè)post只有一個(gè)用戶。因此我們的userinfo數(shù)組將會(huì)僅僅包含一個(gè)元素,我們可以說使用 $unwind操作來解構(gòu)他并插入到一個(gè)自文檔中。
{ "$unwind": "$userinfo" }
現(xiàn)在的輸出將會(huì)轉(zhuǎn)化成更加常用的結(jié)構(gòu):
"userinfo": {
"name": "User One",
"email: "userone@email.com",
…
}
最終我們可以在管道中使用 $project操作返回評(píng)論信息,評(píng)論的時(shí)間,評(píng)論的用戶名,國家等。
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
合并上面所有的操作
我們最終的聚合查詢匹配的評(píng)論,按照順序排序,限制最新的二十條信息,連接用戶的數(shù)據(jù),扁平用戶數(shù)組,最后只返回我們需要的必須數(shù)據(jù),總的命令如下:
db.post.aggregate([
{ "$match": { "rating": "important" } },
{ "$sort": { "date": -1 } },
{ "$limit": 20 },
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} },
{ "$unwind": "$userinfo" },
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
]);
結(jié)果是一個(gè)擁有二十個(gè)文檔的集合,例如:
[
{
"text": "The latest post",
"date: ISODate("2016-09-27T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
},
{
"text": "Another post",
"date: ISODate("2016-09-26T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
}
...
]
MongoDB的$lookup很好用而且很高效,但是上面這個(gè)基礎(chǔ)的例子只是一個(gè)組合的集合查詢。他不是一個(gè)對(duì)SQL中的更加高效的JOIN子句的替代。而且MongoDB也提供了一些限制,如果user集合被刪除了,post文檔還是會(huì)保留。
理想情況下,這個(gè)$lookup操作應(yīng)該不會(huì)經(jīng)常使用,如果你需要經(jīng)常使用它,那么你就使用了錯(cuò)誤的數(shù)據(jù)存儲(chǔ)了(數(shù)據(jù)庫):如果你有相關(guān)聯(lián)的數(shù)據(jù),應(yīng)該使用關(guān)聯(lián)數(shù)據(jù)庫(SQL)。
也就是說$lookup是一個(gè)MongoDB 3.2新加入的,他解決了當(dāng)在Nosql數(shù)據(jù)庫中使用一些小的相關(guān)聯(lián)的數(shù)據(jù)查詢的時(shí)候一些令人失望的問題。
總結(jié)
以上就是這篇文章的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對(duì)腳本之家的支持。
相關(guān)文章
Centos系統(tǒng)搭建MongoDB數(shù)據(jù)庫
這篇文章介紹了Centos系統(tǒng)搭建MongoDB數(shù)據(jù)庫的方法,對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-04-04
使用aggregate在MongoDB中查詢重復(fù)數(shù)據(jù)記錄的方法
這篇文章主要介紹了使用aggregate在MongoDB中查詢重復(fù)數(shù)據(jù)記錄的方法的相關(guān)資料,需要的朋友可以參考下2016-01-01
MongoDB中的push操作詳解(將文檔插入到數(shù)組)
$push操作符添加指定的值到數(shù)組中,下面這篇文章主要給大家介紹了關(guān)于MongoDB中push操作(將文檔插入到數(shù)組)的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-11-11
MongoDB數(shù)據(jù)庫設(shè)置賬號(hào)密碼完整步驟
MongoDB這工具很好用的,頁面美觀,設(shè)置賬號(hào)密碼也必不可少,下面這篇文章主要給大家介紹了關(guān)于MongoDB數(shù)據(jù)庫設(shè)置賬號(hào)密碼的完整步驟,文中給出了詳細(xì)的實(shí)例代碼,需要的朋友可以參考下2023-05-05
分布式文檔存儲(chǔ)數(shù)據(jù)庫之MongoDB分片集群的問題
這篇文章主要介紹了分布式文檔存儲(chǔ)數(shù)據(jù)庫之MongoDB分片集群的問題,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-11-11

