当前位置：网站首页>Sql分组查询后取每组的前N条记录

Sql分组查询后取每组的前N条记录

2020-11-09 10:51:00 【osc_um3gbrdm】

想让APP和微信一样，可以流畅运行小程序？ | 体验即送大疆、华为、樱桃键盘！>>>

一、背景

二、实战解析

三、总结

一、背景

最近，在开发中遇到个功能需求。系统有个资讯查询模块，要求资讯按照卡片形式展示。如下图:

按照项目组展示卡片，每个项目组展示阅读量最多的TOP2。

需求解析：按照项目组分组，然后取每组阅读量最多的前2条。

二、实战解析

基于Mysql数据库

表定义

1、项目组：team

id	主键
name	项目组名称

2、资讯表：info

id	主键
team_id	项目组id
title	资讯名称
pageviews	浏览量
content	资讯内容

info表数据如下图：

我们先预习下Select基础知识

书写顺序:

select *columns* 
from *tables* 
where *predicae1* 
group by *columns* 
having *predicae1* 
order by *columns* 
limit *start*, *offset*;

执行顺序:

from *tables* 
where *predicae1* 
group by *columns* 
having *predicae1* 
select *columns* 
order by *columns* 
limit *start*, *offset*;

count(字段名) # 返回表中该字段总共有多少条记录

DISTINCT 字段名 # 过滤字段中的重复记录

第一步：先找出资讯表中阅读量的前二名

info资讯表自关联

SELECT a.* 
  FROM info a 
WHERE (
        SELECT count(DISTINCT b.pageviews) 
              FROM info b 
                   WHERE a.pageviews < b.pageviews AND a.team_id= b.team_id
      ) < 2 ;

乍一看不好理解，下面举例说明

举个例子：

当阅读量pageviews a = b = [1,2,3,4]

a.pageviews = 1，b.pageviews 可以取值 [2,3,4]，count(DISTINCT b.pageviews) = 3 
a.pageviews = 2，b.pageviews 可以取值 [3,4]，count(DISTINCT b.pageviews) = 2 # 有2条，即第三名 
a.pageviews = 3，b.pageviews 可以取值 [4]，count(DISTINCT b.pageviews) = 1 # 有1条，即第二名 
a.pageviews = 4，b.pageviews 可以取值 []，count(DISTINCT b.pageviews) = 0 # 有0条，即最大 第一名

count(DISTINCT b.pageviews) 代表有几个比这条值大

a.team_id= b.team_id 自关联条件，约等于分组

所以前二名等价于 count(DISTINCT e2.Salary) < 2 ，所以 a.pageviews 可取值为 3、4，即集合前 2 高

第二步：再把表 team和表 info连接

SELECT a.id, t.NAME, a.team_id, a.pageviews 
  FROM info a 
    LEFT JOIN team t ON a.team_id = t.id 
WHERE (
        SELECT count(DISTINCT b.pageviews) 
               FROM info b 
                 WHERE a.pageviews < b.pageviews AND a.team_id= b.team_id) < 2 
ORDER BY a.team_id, a.pageviews desc

结果如下图：

还有一种好理解的方式：

分组GROUP BY + HAVING，这种方式可以一步一步方便调试结果

SELECT a.id, t.NAME, a.team_id, a.pageviews, COUNT( DISTINCT b.pageviews ) 
  FROM info a 
    LEFT JOIN info b ON ( a.pageviews < b.pageviews AND a.team_id = b.team_id ) 
    LEFT JOIN team t ON a.team_id = t.id 
GROUP BY a.id, t.NAME, a.team_id, a.pageviews 
HAVING COUNT( DISTINCT b.pageviews ) < 2 
ORDER BY a.team_id, a.pageviews DESC

问题：如果出现阅读数相同的情况，就裂开了。

举例说明：

当阅读量pageviews a = b = [1,2,2,4]

a.pageviews = 1，b.pageviews 可以取值 [2,2,4]，count(DISTINCT b.pageviews) = 3 
a.pageviews = 2，b.pageviews 可以取值 [4]，count(DISTINCT b.pageviews) = 1 # 有1条，即并列第二名 
a.pageviews = 2，b.pageviews 可以取值 [4]，count(DISTINCT b.pageviews) = 1 # 有1条，即第二名 
a.pageviews = 4，b.pageviews 可以取值 []，count(DISTINCT b.pageviews) = 0 # 有0条，即最大 第一名