SQL Server數(shù)據(jù)匯總五招輕松搞定
本文我們將討論如何使用GROUPBY子句來匯總數(shù)據(jù)。
使用單獨(dú)列分組
GROUP BY子句通過設(shè)置分組條件來匯總數(shù)據(jù),在第一個(gè)例子中,我在數(shù)據(jù)庫(kù)AdventureWork2012中的表 Sales.SalesOrderDetail.中的一列上進(jìn)行數(shù)據(jù)分組操作。這個(gè)例子以及其他例子都使用數(shù)據(jù)庫(kù)AdventureWorks2012,如果你想使用它運(yùn)行我的代碼,你可以點(diǎn)擊下載。
下面是第一個(gè)示例的源碼,在CarrierTrackingNumber列上使用group by子句進(jìn)行數(shù)據(jù)分組操作
USE AdventureWorks2012; GO SELECT CarrierTrackingNumber ,SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail GROUP BY CarrierTrackingNumber;
在我運(yùn)行這段代碼后,會(huì)得到3807個(gè)記錄,下面是這個(gè)龐大的結(jié)果集中前五個(gè)數(shù)值:
CarrierTrackingNumber LineTotal -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 6E46-440A-B5 2133.170700 B501-448E-96 4085.409800 8551-4CDF-A1 72616.524200 B65C-4867-86 714.704300 99CE-4ADA-B1 16185.429200
在上面的示例中,我使用group by子句選擇哪些列作為聚集dventureWorks2012.Sales.SalesOrderDetai數(shù)據(jù)表數(shù)據(jù)的條件,在例子中,我使用CarrierTrackingNumber匯總數(shù)據(jù),當(dāng)你進(jìn)行數(shù)據(jù)分組時(shí),只有在group By 子句中出現(xiàn)的列才在selection 列表中有效。在我的示例中,我使用聚集函數(shù)SUM計(jì)算LineTotal,為了使用方便,我為它設(shè)置了別名SummarizedLineTotal。
如果我想獲得CarrierTrackingNumber 滿足特定條件下的聚集集合,那我可以在Where子句中對(duì)查詢進(jìn)行限制,就像我下面做的這樣:
USE AdventureWorks2012; GO SELECT CarrierTrackingNumber ,SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail WHERE CarrierTrackingNumber = '48F2-4141-9A' GROUP BY CarrierTrackingNumber;
這里我在原始查詢基礎(chǔ)上在where子句中加上了一條限制,我設(shè)置了我的查詢只返回CarrierTrackingNumber 等于一個(gè)特定值的結(jié)果。運(yùn)行這段代碼后,我會(huì)得到記錄中CarrierTrackingNumber 等于48F2-4141-9A的行的數(shù)量。Where子句的過濾行為在數(shù)據(jù)被聚集之前就已生效。
通過多列來分組
有時(shí)候你可能需要使用多列來進(jìn)行數(shù)據(jù)分組,下面是我使用多列進(jìn)行分組的示例代碼
SELECT D.ProductID , H.OrderDate , SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail D JOIN AdventureWorks2012.Sales.SalesOrderHeader H ON D.SalesOrderId = H.SalesOrderID GROUP BY ProductID, OrderDate;
查詢返回26878行數(shù)據(jù),這是上面查詢返回的部分結(jié)果:
ProductID OrderDate LineTotal -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- -- 714 2008-05-21 00:00:00.000 99.980000 859 2007-11-03 00:00:00.000 48.980000 923 2007-11-23 00:00:00.000 14.970000 712 2007-12-22 00:00:00.000 62.930000 795 2007-10-14 00:00:00.000 2443.350000 950 2007-07-01 00:00:00.000 2462.304000 795 2007-11-06 00:00:00.000 2443.350000 877 2007-11-19 00:00:00.000 15.900000 713 2007-10-01 00:00:00.000 99.980000 860 2008-05-31 00:00:00.000 48.980000 961 2008-05-01 00:00:00.000 36242.120880
在上面的示例程序中,Group by 子句中用到了ProductID列與OrderDate列,SQL Server基于ProductID和OrderDate二者組合的唯一性,返回LineTotal的值,并為其設(shè)置別名SummarizedLineTotal。如果你查看程序的輸出,你會(huì)發(fā)現(xiàn)SQL Server 對(duì)數(shù)據(jù)進(jìn)行分組后,返回的結(jié)果并沒有特定的順序,如果你需要返回結(jié)果按照一定順序排序,你需要使用ORDER BY 子句,就像我在下面代碼中展示的那樣。
SELECT D.ProductID , H.OrderDate , SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail D JOIN AdventureWorks2012.Sales.SalesOrderHeader H ON D.SalesOrderId = H.SalesOrderID GROUP BY ProductID, OrderDate ORDER BY SummarizedLineTotal DESC;
在上面的代碼中,我按照SummorizedLineTotal降序?qū)Y(jié)果集進(jìn)行排序,此列的值通過Group BY子句分組后對(duì)LineTotal使用聚合函數(shù)Sum得到。我對(duì)結(jié)果按照SummorizedLineTotal 的值降序排列。如果你運(yùn)行此程序,你可以得出LineTotal 數(shù)量最高的ProductID和OrderDate。
對(duì)沒有任何值的數(shù)據(jù)進(jìn)行分組
有時(shí)候你會(huì)需要對(duì)一些記錄中包含空值的數(shù)據(jù)進(jìn)行分組操作。當(dāng)你在SQL Server 執(zhí)行此類操作時(shí),它會(huì)自動(dòng)假設(shè)所有NULL值相等。讓我看一下下面的示例程序
CREATE TABLE NullGroupBy (OrderDate date, Amount Int);
INSERT INTO NullGroupBy values (NULL,100),
('10-30-2014',100),
('10-31-2014',100),
(NULL,100);
SELECT OrderDate, SUM(Amount) as TotalAmount
FROM NullGroupBy
GROUP BY OrderDate;
DROP TABLE NullGroupBy;
When I run this code I get the following output:
OrderDate TotalAmount
-- -- -- -- -- -- -- -- -- -- -
NULL 200
2014-10-30 100
2014-10-31 100
在上面的程序中,我首先創(chuàng)建并填充了一個(gè)NullGroupBy表.在這個(gè)表中,我放置了四個(gè)不同的行,第一行和最后一行的orderDate列值為NULL,其他兩列的orderDate值不同。從上面的輸出結(jié)果可以看到,SQL Server 在分組時(shí)將OrderDate為NULL的兩行聚集為一行處理。
在Group BY 子句中使用表達(dá)式
有時(shí)你需要在Group by子句中使用表達(dá)式,而不是具體的列。SQL Server允許你在Group By子句中指定一個(gè)表達(dá)式,就像下面的代碼中所示:
SELECT CONVERT(CHAR(7),H.OrderDate,120) AS [YYYY-MM] , SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail D JOIN AdventureWorks2012.Sales.SalesOrderHeader H ON D.SalesOrderId = H.SalesOrderID GROUP BY CONVERT(CHAR(7),H.OrderDate,120) ORDER BY SummarizedLineTotal DESC;
上述代碼使用OrderDate 列中的年月數(shù)據(jù)進(jìn)行分組,通過使用表達(dá)式CONVERT(CHAR(7),H.OrderDate,120) ,我告訴SQL服務(wù)器截取OrderDate ODBC標(biāo)準(zhǔn)日期格式的前七個(gè)字符,也就是OrderDate yyyy-mm部分?;谶@個(gè)表達(dá)式,我可以找出特定年月的total SummarizeLineTotal值,在Group By子句中使用表達(dá)式,以及對(duì)LineTotal值排序,我可以找出哪一年哪一個(gè)月的SummarizeLineTotal最大或最小。
使用HAVING子句過濾數(shù)據(jù)
Having 是另外一個(gè)能與Group BY 子句結(jié)合使用的重要子句,使用Having 子句,你可以過濾掉不符合Having子句所接表達(dá)式的數(shù)據(jù)行,當(dāng)我在其上使用where子句時(shí),在聚集之前就會(huì)產(chǎn)生過濾行為。Having 子句允許你基于某些標(biāo)準(zhǔn)過濾聚合行。想要更清楚地了解Having子句,請(qǐng)參考下面代碼:
SELECT D.ProductID , H.OrderDate , SUM(LineTotal) AS SummarizedLineTotal FROM AdventureWorks2012.Sales.SalesOrderDetail D JOIN AdventureWorks2012.Sales.SalesOrderHeader H ON D.SalesOrderId = H.SalesOrderID GROUP BY ProductID, OrderDate HAVING SUM(LineTotal) > 200000 ORDER BY SummarizedLineTotal DESC;
在上面的代碼中Having子句限制條件是SUM(LineTotal) > 200000。這個(gè)having子句保證最終結(jié)果中LineTotal的聚合值(SummarizedLineTotal)大于200000.通過使用having子句,我的查詢只返回一行數(shù)據(jù),其SummarizedLineTotal大于200000.having子句允許SQL Server 只返回聚合結(jié)果滿足Having子句限制的條件的數(shù)據(jù)行。
總結(jié)
許多應(yīng)用要求數(shù)據(jù)在展示之前要經(jīng)過一定的匯總操作,GROUP BY子句就是SQL Server提供的匯總數(shù)據(jù)的機(jī)制。GROUPBY子句允許你使用HAVING子句對(duì)匯總數(shù)據(jù)進(jìn)行特定的過濾。希望下次你需要匯總一些數(shù)據(jù)的時(shí)候,你可以更加容易的達(dá)到目的。
相關(guān)文章
SQL Server 排序函數(shù) ROW_NUMBER和RANK 用法總結(jié)
下面的例子和SQL語句均在SQL Server 2008環(huán)境下運(yùn)行通過,使用SQL Server自帶的AdventureWorks數(shù)據(jù)庫(kù)。2009-07-07
SQL Server開放(或關(guān)閉)端口連接的實(shí)現(xiàn)步驟
為了保證系統(tǒng)的安全性,可以關(guān)閉/開啟端口,本文主要介紹了SQL Server開放(或關(guān)閉)端口連接的實(shí)現(xiàn)步驟,具有一定的參考價(jià)值,感興趣的可以了解一下2023-11-11
SqlServer中根據(jù)某幾列獲取重復(fù)的數(shù)據(jù)將其刪除并保留最新一條
有時(shí)候,我們某個(gè)數(shù)據(jù)表中,可能有幾列的數(shù)據(jù)都是一樣的,此時(shí)我們可能想查詢出這幾列數(shù)據(jù)相同的所有數(shù)據(jù)行,并保留最新一條,將其他重復(fù)的數(shù)據(jù)刪除,這篇文章主要介紹了SqlServer中根據(jù)某幾列獲取重復(fù)的數(shù)據(jù)將其刪除并保留最新一條,感興趣的朋友一起看看吧2024-04-04
使用sqlserver官方驅(qū)動(dòng)包調(diào)用存儲(chǔ)過程遇到的坑及解決方法
這篇文章主要介紹了用sqlserver官方驅(qū)動(dòng)包調(diào)用存儲(chǔ)過程遇到的一個(gè)坑,解決方法大概就是換驅(qū)動(dòng)包,在在存儲(chǔ)過程首行添加 set nocount on ,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-10-10
SQLServer查詢歷史執(zhí)行記錄的方法實(shí)現(xiàn)
有的時(shí)候,需要知道近段時(shí)間SQLSERVER執(zhí)行了什么語句,本文主要介紹了SQLServer查詢歷史執(zhí)行記錄的方法實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下2023-09-09
一步步教你建立SQL數(shù)據(jù)庫(kù)的表分區(qū)
分區(qū)存儲(chǔ)提高了數(shù)據(jù)庫(kù)的性能,被分區(qū)存儲(chǔ)的數(shù)據(jù)物理上是多個(gè)文件,但邏輯上任然是一個(gè)表,對(duì)表的任何操作都跟沒分區(qū)之前一樣。插入、刪除、查詢、更新等操作的時(shí)候,數(shù)據(jù)庫(kù)會(huì)自動(dòng)為你找到對(duì)應(yīng)的分區(qū),然后執(zhí)行操作。2015-09-09
sqlserver數(shù)據(jù)庫(kù)遷移后,孤立賬號(hào)解決辦法
sqlserver數(shù)據(jù)庫(kù)遷移后,孤立賬號(hào)解決辦法,需要的朋友可以參考下。2011-10-10
SQL Server 表變量和臨時(shí)表的區(qū)別(詳細(xì)補(bǔ)充篇)
這篇文章主要介紹了SQL Server 表變量和臨時(shí)表的區(qū)別(詳細(xì)補(bǔ)充篇),需要的朋友可以參考下2015-11-11

