当前位置: 首页 > news >正文

SQL关键字三分钟入门:ROW_NUMBER() —— 窗口函数为每一行编号

在进行数据分析时,我们常常需要为查询结果集中的每条记录生成一个唯一的序号或行号。例如:

  • 为每位员工按照入职时间排序并编号;
  • 按照订单金额对订单进行排序,并给每个订单分配一个顺序编号;
  • 在分组数据内为每条记录编号。

这时候就需要使用 SQL 中非常有用的窗口函数 —— ROW_NUMBER()

它可以帮助我们轻松地为查询结果集中的每一行分配一个独一无二的行号,特别适合处理涉及排序和分组的数据分析任务。


 什么是 ROW_NUMBER()?

ROW_NUMBER() 是 SQL 中用于为分区或整个结果集中的行生成唯一行号的窗口函数。它会根据指定的排序规则为每条记录分配一个连续的行号,即使存在相同的值也不会导致行号跳过。

你可以把它理解为:“按照某个标准给每条记录打上独一无二的行号标签”。


 基本语法

SELECT column1, column2, ..., 
ROW_NUMBER() OVER ([PARTITION BY partition_column]ORDER BY sort_column [ASC|DESC], ...
) AS row_num
FROM table_name;
  • PARTITION BY(可选):定义如何将数据划分为不同的分区(类似于 GROUP BY),每个分区独立进行编号。
  • ORDER BY:指定用于决定行号顺序的列及其方向(升序或降序)。

 示例讲解

假设我们有一个 employees 表,记录了员工的信息:

employee_idnamehire_date
1张三2020-06-01
2李四2019-05-23
3王五2021-07-15
4赵六2020-08-10
5孙七2018-03-12

 示例1:按入职日期为所有员工编号

SELECT name, hire_date,
ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namehire_daterow_num
孙七2018-03-121
李四2019-05-232
张三2020-06-013
赵六2020-08-104
王五2021-07-155

 注意:这里我们按入职日期进行了升序排列,并为每位员工分配了一个连续的行号。


 示例2:按部门对员工进行编号(使用 PARTITION BY)

假设我们增加了一个 department 列来表示员工所属的部门:

employee_idnamedepartmenthire_date
1张三销售部2020-06-01
2李四销售部2019-05-23
3王五技术部2021-07-15
4赵六技术部2020-08-10
5孙七销售部2018-03-12
SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num
FROM employees;
结果:
namedepartmenthire_daterow_num
孙七销售部2018-03-121
李四销售部2019-05-232
张三销售部2020-06-013
王五技术部2021-07-151
赵六技术部2020-08-102

 这里我们按部门进行了划分,然后在每个部门内部根据入职日期进行编号。


 示例3:结合其他聚合函数使用

有时候你可能还需要同时计算一些汇总信息,比如总人数、平均入职年限等。下面的例子展示了如何同时显示编号和部门总人数:

SELECT name, department, hire_date,
ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num,
COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept
FROM employees;
结果:
namedepartmenthire_daterow_numtotal_employees_in_dept
孙七销售部2018-03-1213
李四销售部2019-05-2323
张三销售部2020-06-0133
王五技术部2021-07-1512
赵六技术部2020-08-1022

注意

对比项使用建议
唯一行号即使有相同的排序值,ROW_NUMBER() 也会为每条记录分配一个唯一的行号
不同的排名函数RANK():允许并列排名,但会导致行号跳跃
DENSE_RANK():与 RANK() 类似,但不会跳过行号
性能优化尽量减少 PARTITION BY 的范围以提高性能
数据一致性在执行复杂的编号操作时,确保数据的一致性和准确性

 总结对比表

场景SQL 示例
按单一条件编号SELECT ..., ROW_NUMBER() OVER (ORDER BY hire_date ASC) AS row_num FROM employees;
按部门内条件编号SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num FROM employees;
结合其他聚合函数使用SELECT ..., ROW_NUMBER() OVER (PARTITION BY department ORDER BY hire_date ASC) AS row_num, COUNT(*) OVER (PARTITION BY department) AS total_employees_in_dept FROM employees;

希望这篇简短的指南帮助你快速了解了 ROW_NUMBER() 窗口函数的强大功能。

http://www.lqws.cn/news/561331.html

相关文章:

  • FreeSWITCH配置文件解析(2) dialplan 拨号计划中xml 的action解析
  • 第一章 从零开始学习大型语言模型-搭建环境
  • 人大金仓数据库jdbc连接jar包kingbase8-8.6.0.jar驱动包最新版下载(不需要积分)
  • 5G核心网,NAS短消息的实现
  • 可编程逻辑器件的发展与比较
  • 构建 AI 系统的 4 大 Agentic AI 设计模式
  • Python 可迭代的对象、迭代器 和生成器(何时使用生成器表达式)
  • 2099. 找到和最大的长度为 K 的子序列
  • 第6篇:中间件——Gin的请求处理管道
  • 大事件项目记录10-文章分类接口开发-更新文章分类
  • AtCoder AT_abc412_c [ABC412C] Giant Domino 题解
  • JavaEE:CAS单点登录
  • 数据结构1 ——数据结构的基本概念+一点点算法
  • 表达式求值
  • Brocade 博科交换机配置带外管理IP
  • 【unity游戏开发——网络】网络协议、TCP vs UDP 本质区别
  • 第九节:Vben Admin 最新 v5.0 (vben5) 快速入门 - 菜单管理(上)
  • AI间对话APK制成
  • Centos 8设置固定IP
  • STM32中Usart的使用
  • WordPress最新版6.8.1安装教程
  • 前缀和 + 哈希表
  • NV046NV060美光固态闪存NV061NV063
  • 从用户到权限:解密 AWS IAM Identity Center 的授权之道
  • Linux更改国内镜像源
  • ZooKeeper深度面试指南三
  • Hadoop集群异常:两个NameNode全部为StandBy状态
  • 【中文核心期刊推荐】《计算机工程与设计》
  • linux学习第26天(信号集)
  • llm 基本案例实现