MongoDB中如何使用JOIN操作詳解

更新時(shí)間：2017年07月12日 10:25:52 作者：都市煙火

相信大家都知道m(xù)ongodb是不支持join操作的，因此我們只能自己來實(shí)現(xiàn)這個(gè)功能。所以下面這篇文章主要給大家介紹了關(guān)于在MongoDB中如何使用JOIN操作的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，需要的朋友們下面來一起看看吧。

前言

MongoDB是由C++語言所編寫的一種面向文檔的非關(guān)系型數(shù)據(jù)庫(是一種NoSql數(shù)據(jù)庫實(shí)現(xiàn))，也是介于關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)存儲(chǔ)產(chǎn)品，而眾所周知SQL與NoSQL最大的不同之一就是不支持JOIN，在傳統(tǒng)的數(shù)據(jù)庫中，SQL JOIN子句允許你使用普通的字段，在兩個(gè)或者是更多表中的組合表中的每行數(shù)據(jù)。例如，如果你有表books和publishers，你可以像下面這樣寫命令：

SELECT book.title, publisher.name
FROM book
LEFT JOIN book.publisher_id ON publisher.id;

換句話說，book表中的publisher_id字段引用了publishers表中的id字典。這些都是很常見的例子：對(duì)于每個(gè)publisher都可以擁有成千上萬本書，如果你想更新publisher的信息的時(shí)候，我們只需要更改一條記錄。數(shù)據(jù)的冗余是很小的，因?yàn)槲覀儾恍枰獮槊勘緯鴣碇貜?fù)更新他的publisher信息，這種技術(shù)已基本當(dāng)做一種規(guī)范化的東西了。SQL數(shù)據(jù)庫提供了一些列的規(guī)范與約束條件來保障數(shù)據(jù)關(guān)聯(lián)性。

--------------------------------------------------------------------------------

NoSQL == No JOIN?

并不都是這樣吧。。。。。

--------------------------------------------------------------------------------

面向文檔的數(shù)據(jù)庫，例如MongoDB，被設(shè)計(jì)用來存儲(chǔ)非結(jié)構(gòu)化的數(shù)據(jù)，理想情況下，這些數(shù)據(jù)是在數(shù)據(jù)集合中是相互沒有關(guān)聯(lián)的，如果一條數(shù)據(jù)包含兩次或者更多次，那數(shù)據(jù)就重復(fù)了。因?yàn)榇蟛糠智闆r下我們還是需要數(shù)據(jù)關(guān)聯(lián)的，只有很少的情況下才會(huì)不需要關(guān)聯(lián)數(shù)據(jù)，看來NoSQL這些特性看來讓人失望啊。幸運(yùn)的是MongoDB 3.2 介紹了一個(gè)新的$lookup操作，這個(gè)操作可以提供一個(gè)類似于LEFT OUTER JOIN的操作在兩個(gè)或者是更多的條件下。

--------------------------------------------------------------------------------

MongoDB Aggregation

$lookup僅僅在 aggregation操作中才被允許使用，想想他作為一個(gè)管道操作：查詢，過濾，組合結(jié)果。一個(gè)操作的輸出被作為下一個(gè)的輸入。Aggregation比簡(jiǎn)單的查詢操作更難于理解，而且這些操作通常運(yùn)行很慢，然而他們很高效，Aggregation可以使用一個(gè)很好的例子來解釋，假設(shè)我們使用user數(shù)據(jù)集合來創(chuàng)建一個(gè)社交平臺(tái)，在每個(gè)獨(dú)立的文檔中存儲(chǔ)沒個(gè)用戶的信息，例如：

{
 "_id": ObjectID("45b83bda421238c76f5c1969"),
 "name": "User One",
 "email: "userone@email.com",
 "country": "UK",
 "dob": ISODate("1999-09-13T00:00:00.000Z")
}

我們可以向user這個(gè)集合中添加足夠多的用戶，但是每個(gè)MongoDB文檔都必須有一個(gè)為一個(gè)_id字段值，這個(gè)_id字段值就像SQL中的鍵，在我們沒有明確指定_id的時(shí)候會(huì)被自動(dòng)的加入到文檔中。我們的社交網(wǎng)站現(xiàn)在需要一個(gè)post集合，這個(gè)結(jié)合存儲(chǔ)用戶的評(píng)論，這個(gè)文檔存儲(chǔ)純文本，時(shí)間，評(píng)分，一個(gè)被寫到user_id字段的玩家引用。

{
 "_id": ObjectID("17c9812acff9ac0bba018cc1"),
 "user_id": ObjectID("45b83bda421238c76f5c1969"),
 "date: ISODate("2016-09-05T03:05:00.123Z"),
 "text": "My life story so far",
 "rating": "important"
}

我們現(xiàn)在想要顯示最近具有important評(píng)論的二十條數(shù)據(jù)，這些數(shù)據(jù)來自所有的用戶，并且是按照時(shí)間排序的。每一個(gè)返回的文檔中應(yīng)該包含評(píng)論的文本，發(fā)布評(píng)論的時(shí)間，以及相關(guān)的用戶的名字和國家。

MongoDB數(shù)據(jù)庫的aggregate查詢是通過傳遞管道操作的數(shù)組，這個(gè)數(shù)組中順序的定了每個(gè)操作。首先，我們需要從所有的post集合中提取出所有的文檔，這些文檔使用$match記性準(zhǔn)確rating過濾。

{ "$match": { "rating": "important" } }

我們現(xiàn)在需要對(duì)過濾出來的文檔按照時(shí)間，使用$sort操作進(jìn)行排序。

{ "$sort": { "date": -1 } }

因?yàn)槲覀円獌H僅返回二十條數(shù)據(jù)，我們可以使用$limit來限制我們需要處理的文檔數(shù)量。

{ "$limit": 20 }

我們現(xiàn)在使用$lookup操作從user集合中連接數(shù)據(jù)，這個(gè)操作需要一個(gè)四個(gè)參數(shù)的對(duì)象：

1、localField：在輸入文檔中的查找字段

2、from：需要連接的集合

3、foreignField：需要在from集合中查找的字段

4、as：輸出的字段名字

所以我們的操作是這樣的：

{ "$lookup": {
 "localField": "user_id",
 "from": "user",
 "foreignField": "_id",
 "as": "userinfo"
} }

在我們的輸出中將會(huì)創(chuàng)建一個(gè)名為userinfo的新字段，他是一個(gè)數(shù)組，其中每個(gè)元素都是在user集合中匹配的元素。

"userinfo": [
 { "name": "User One", ... }
]

在post.user_id與user._id之間，我們具有一對(duì)一的關(guān)系，因?yàn)閷?duì)于每一個(gè)post只有一個(gè)用戶。因此我們的userinfo數(shù)組將會(huì)僅僅包含一個(gè)元素，我們可以說使用 $unwind操作來解構(gòu)他并插入到一個(gè)自文檔中。

{ "$unwind": "$userinfo" }

現(xiàn)在的輸出將會(huì)轉(zhuǎn)化成更加常用的結(jié)構(gòu)：

"userinfo": {
 "name": "User One",
 "email: "userone@email.com",
 …
}

最終我們可以在管道中使用 $project操作返回評(píng)論信息，評(píng)論的時(shí)間，評(píng)論的用戶名，國家等。

{ "$project": {
 "text": 1,
 "date": 1,
 "userinfo.name": 1,
 "userinfo.country": 1
} }

合并上面所有的操作

我們最終的聚合查詢匹配的評(píng)論，按照順序排序，限制最新的二十條信息，連接用戶的數(shù)據(jù)，扁平用戶數(shù)組，最后只返回我們需要的必須數(shù)據(jù)，總的命令如下：

db.post.aggregate([
 { "$match": { "rating": "important" } },
 { "$sort": { "date": -1 } },
 { "$limit": 20 },
 { "$lookup": {
 "localField": "user_id",
 "from": "user",
 "foreignField": "_id",
 "as": "userinfo"
 } },
 { "$unwind": "$userinfo" },
 { "$project": {
 "text": 1,
 "date": 1,
 "userinfo.name": 1,
 "userinfo.country": 1
 } }
]);

結(jié)果是一個(gè)擁有二十個(gè)文檔的集合，例如：

[
 {
 "text": "The latest post",
 "date: ISODate("2016-09-27T00:00:00.000Z"),
 "userinfo": {
  "name": "User One",
  "country": "UK"
 }
 },
 {
 "text": "Another post",
 "date: ISODate("2016-09-26T00:00:00.000Z"),
 "userinfo": {
  "name": "User One",
  "country": "UK"
 }
 }
 ...
]

MongoDB的$lookup很好用而且很高效，但是上面這個(gè)基礎(chǔ)的例子只是一個(gè)組合的集合查詢。他不是一個(gè)對(duì)SQL中的更加高效的JOIN子句的替代。而且MongoDB也提供了一些限制，如果user集合被刪除了，post文檔還是會(huì)保留。

理想情況下，這個(gè)$lookup操作應(yīng)該不會(huì)經(jīng)常使用，如果你需要經(jīng)常使用它，那么你就使用了錯(cuò)誤的數(shù)據(jù)存儲(chǔ)了（數(shù)據(jù)庫）：如果你有相關(guān)聯(lián)的數(shù)據(jù)，應(yīng)該使用關(guān)聯(lián)數(shù)據(jù)庫（SQL）。

也就是說$lookup是一個(gè)MongoDB 3.2新加入的，他解決了當(dāng)在Nosql數(shù)據(jù)庫中使用一些小的相關(guān)聯(lián)的數(shù)據(jù)查詢的時(shí)候一些令人失望的問題。

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來一定的幫助，如果有疑問大家可以留言交流，謝謝大家對(duì)腳本之家的支持。

您可能感興趣的文章: