SQL必知必会——汇总数据

原创于 2026-06-20 20:47:23 发布 · 24 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#sql #数据库

SQL必知必会专栏收录该内容

10 篇文章

订阅专栏

汇总数据

1、聚集函数

我们经常需要汇总数据而不用把它们实际检索出来，为此SQL提供了专门的函数。使用这些函数，SQL查询可用于检索数据，以便分析和报表生成。这种类型的检索例子有：

确定表中行数（或者满足某个条件或包含某个特定值的行数）；
获得表中某些行的和；
找出表列（或所有行或某些特定的行）的最大值、最小值、平均值。

上述例子都需要汇总出表中的数据，而不需要查出数据本身。因此，返回实际表数据纯属浪费时间和处理资源（更不用说带宽了）。再说一遍，我们实际想要的是汇总信息。

为方便这种类型的检索，SQL给出了5个聚集函数，见下表。这些函数能进行上述检索。与前一章介绍的数据处理函数不同，SQL的聚集函数在各种主要SQL实现中得到了相当一致的支持。

在这里插入图片描述

1.1、AVG()函数

AVG()通过对表中行数计数并计算其列值之和，求得该列的平均值。AVG()可用来返回所有列的平均值，也可以用来返回特定列或行的平均值。

SELECT AVG(prod_price) AS avg_price
FROM Products;

+-----------+
| avg_price |
+-----------+
|  6.823333 |
+-----------+
1 row in set (0.06 sec)

AVG()也可以用来确定特定列或行的平均值。下面的例子返回特定供应商所提供产品的平均价格：

SELECT AVG(prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';

+-----------+
| avg_price |
+-----------+
|  3.865000 |
+-----------+
1 row in set (0.07 sec)

AVG()只能用来确定特定数值列的平均值，而且列名必须作为函数参数给出。为了获得多个列的平均值，必须使用多个AVG()函数。

AVG()函数忽略列值为NULL的行。

1.2、COUNT()函数

COUNT()函数进行计数。可利用COUNT()确定表中行的数目或符合特定条件的行的数目。COUNT()函数有两种使用方式：

使用COUNT(＊)对表中行的数目进行计数，不管表列中包含的是空值（NULL）还是非空值。
使用COUNT(column)对特定列中具有值的行进行计数，忽略NULL值。

下面的例子返回Customers表中顾客的总数：

SELECT COUNT(*) AS num_cust
FROM Customers;

+----------+
| num_cust |
+----------+
|        5 |
+----------+
1 row in set (0.07 sec)

在此例子中，利用COUNT(＊)对所有行计数，不管行中各列有什么值。计数值在num_cust中返回。

下面的例子只对具有电子邮件地址的客户计数：

SELECT COUNT(cust_email) AS num_cust
FROM Customers;

+----------+
| num_cust |
+----------+
|        3 |
+----------+
1 row in set (0.07 sec)

这条SELECT语句使用COUNT(cust_email)对cust_email列中有值的行进行计数。在此例子中，cust_email的计数为3（表示5个顾客中只有3个顾客有电子邮件地址）。

如果指定列名，则COUNT()函数会忽略指定列的值为NULL的行，但如果COUNT()函数中用的是星号（＊），则不忽略。

1.3、MAX()函数

MAX()返回指定列中的最大值。MAX()要求指定列名，如下所示：

SELECT MAX(prod_price) AS max_price
FROM Products;

+-----------+
| max_price |
+-----------+
|     11.99 |
+-----------+
1 row in set (0.06 sec)

虽然MAX()一般用来找出最大的数值或日期值，但许多（并非所有）DBMS允许将它用来返回任意列中的最大值，包括返回文本列中的最大值。在用于文本数据时，MAX()返回按该列排序后的最后一行。

MAX()函数忽略列值为NULL的行。

1.4、MIN()函数

MIN()的功能正好与MAX()功能相反，它返回指定列的最小值。与MAX()一样，MIN()要求指定列名，如下所示：

SELECT MIN(prod_price) AS min_price
FROM Products;

+-----------+
| min_price |
+-----------+
|      3.49 |
+-----------+
1 row in set (0.07 sec)

虽然MIN()一般用来找出最小的数值或日期值，但许多（并非所有）DBMS允许将它用来返回任意列中的最小值，包括返回文本列中的最小值。在用于文本数据时，MIN()返回该列排序后最前面的行。

MIN()函数忽略列值为NULL的行。

1.5、SUM()函数

SUM()用来返回指定列值的和（总计）。

下面举一个例子，OrderItems包含订单中实际的物品，每个物品有相应的数量。可如下检索所订购物品的总数（所有quantity值之和）：

SELECT SUM(quantity) AS items_ordered
FROM OrderItems
WHERE order_num = 20005;

+---------------+
| items_ordered |
+---------------+
|           200 |
+---------------+
1 row in set (0.07 sec)

SUM()也可以用来合计计算值。在下面的例子中，合计每项物品的item_price＊quantity，得出总的订单金额：

select sum(item_price * quantity) as total_price
from OrderItems
where order_num = 20005;

+-------------+
| total_price |
+-------------+
|     1648.00 |
+-------------+
1 row in set (0.07 sec)

SUM()函数忽略列值为NULL的行。

2、聚集不同值

以上5个聚集函数都可以如下使用。

对所有行执行计算，指定ALL参数或不指定参数（因为ALL是默认行为）。
只包含不同的值，指定DISTINCT参数。

下面的例子使用AVG()函数返回特定供应商提供的产品的平均价格。它与上面的SELECT语句相同，但使用了DISTINCT参数，因此平均值只考虑各个不同的价格：

SELECT AVG(DISTINCT prod_price) AS avg_price
FROM Products
WHERE vend_id = 'DLL01';

+-----------+
| avg_price |
+-----------+
|  4.240000 |
+-----------+
1 row in set (0.07 sec)

可以看到，在使用了DISTINCT后，此例子中的avg_price比较高，因为有多个物品具有相同的较低价格。排除它们提升了平均价格。

如果指定列名，则DISTINCT只能用于COUNT()。DISTINCT不能用于COUNT(＊)。类似地，DISTINCT必须使用列名，不能用于计算或表达式。

3、组合聚集函数

目前为止的所有聚集函数例子都只涉及单个函数。但实际上，SELECT语句可根据需要包含多个聚集函数。请看下面的例子：

SELECT COUNT(*) AS num_items,
        MIN(prod_price) AS price_min,
        MAX(prod_price) AS price_max,
        AVG(prod_price) AS price_avg
FROM Products;

+-----------+-----------+-----------+-----------+
| num_items | price_min | price_max | price_avg |
+-----------+-----------+-----------+-----------+
|         9 |      3.49 |     11.99 |  6.823333 |
+-----------+-----------+-----------+-----------+
1 row in set (0.06 sec)