当前位置: 首页 > news >正文

如何写一条高效分页 SQL?

如何写一条高效分页 SQL?

1. 分页查询基础原理

分页查询的核心是通过LIMITOFFSET子句实现数据切片。基本语法:

SELECT * FROM table_name 
WHERE [conditions] 
ORDER BY [sort_columns] 
LIMIT page_size OFFSET (page_num - 1) * page_size;

Ai专栏:https://duoke360.com/tutorial/path/ai-lm

关键结论:分页本质是通过OFFSET跳过前N条记录,返回后续的M条记录

2. 传统分页的性能问题

2.1 OFFSET 的缺陷

  • 全表扫描:MySQL必须读取OFFSET+N行数据然后丢弃前N行
  • 深度分页瓶颈:当OFFSET值很大时性能急剧下降
  • 数据一致性风险:在分页过程中如有数据变更,可能导致重复或遗漏
-- 低效的深度分页示例(第10000页,每页10条)
SELECT * FROM users 
ORDER BY create_time 
LIMIT 10 OFFSET 99990;  -- 需要先扫描99990行

2.2 性能对比实验

数据量OFFSET值执行时间
100万10000.1s
100万1000002.3s
100万9000008.7s

3. 高效分页方案

3.1 基于主键的"游标分页"

-- 第一页
SELECT * FROM users 
WHERE id > 0  -- 初始条件
ORDER BY id 
LIMIT 10;-- 后续页(假设上一页最后一条记录的id=123)
SELECT * FROM users 
WHERE id > 123  -- 使用上次获取的最大ID
ORDER BY id 
LIMIT 10;

关键优势:通过WHERE条件过滤替代OFFSET,利用索引覆盖实现高效查询

3.2 复合索引优化

对于多字段排序场景:

-- 创建复合索引
CREATE INDEX idx_time_status ON orders(create_time, status);-- 分页查询
SELECT * FROM orders 
WHERE (create_time, status) > ('2023-01-01', 'paid')  -- 游标值
ORDER BY create_time, status
LIMIT 10;

3.3 延迟关联(Deferred Join)

-- 先通过覆盖索引获取主键
SELECT id FROM products 
WHERE category = 'electronics'
ORDER BY price DESC
LIMIT 10000, 10;-- 再通过主键关联获取完整数据
SELECT p.* FROM products p
JOIN (SELECT id FROM products WHERE category = 'electronics'ORDER BY price DESCLIMIT 10000, 10
) AS tmp ON p.id = tmp.id;

4. 高级优化技巧

4.1 预计算分页

-- 使用物化视图
CREATE MATERIALIZED VIEW user_page_view AS
SELECT id, name, ROW_NUMBER() OVER (ORDER BY score DESC) AS row_num
FROM users;-- 分页查询
SELECT * FROM user_page_view
WHERE row_num BETWEEN 1001 AND 1010;

4.2 分片并行查询

-- 将大分页拆分为多个子查询
(SELECT * FROM logs WHERE id % 4 = 0 ORDER BY id LIMIT 250 OFFSET 0)
UNION ALL
(SELECT * FROM logs WHERE id % 4 = 1 ORDER BY id LIMIT 250 OFFSET 0)
UNION ALL
-- ...合并后取前1000条

5. 不同数据库的特殊实现

5.1 MySQL

-- 8.0+版本窗口函数
SELECT * FROM (SELECT *, ROW_NUMBER() OVER (ORDER BY salary DESC) AS rnFROM employees
) AS t WHERE rn BETWEEN 11 AND 20;

5.2 PostgreSQL

-- 使用更高效的游标
BEGIN;
DECLARE pc CURSOR FOR SELECT * FROM products ORDER BY price DESC;
MOVE ABSOLUTE 1000 IN pc;
FETCH 10 FROM pc;
COMMIT;

5.3 Oracle

-- 使用ROWNUM伪列
SELECT * FROM (SELECT a.*, ROWNUM rn FROM (SELECT * FROM customers ORDER BY last_purchase DESC) a WHERE ROWNUM <= 20
) WHERE rn > 10;

6. 面试问题准备

6.1 常见面试题

  1. 如何优化LIMIT 100000, 10这样的查询?
  2. 分页时出现重复数据可能是什么原因?
  3. 如何实现"无限滚动"分页?

6.2 回答要点

  • 避免直接大偏移量OFFSET
  • 强调索引覆盖的重要性
  • 说明游标分页的工作原理
  • 提及不同数据库的特定优化方法

终极建议:在真实业务中,应该限制可访问的页数(如只允许访问前100页),或改用基于游标的分页方案

http://www.lqws.cn/news/99811.html

相关文章:

  • 高考数学易错考点02 | 临阵磨枪
  • Go Modules 详解 -《Go语言实战指南》
  • 【图像处理入门】4. 图像增强技术——对比度与亮度的魔法调节
  • 悟饭游戏厅苹果版(悟饭掌悦)|iOS游戏社区手柄工具
  • 建筑工程施工进度智能编排系统 (SCS-BIM)
  • 基于大模型的短暂性脑缺血发作(TIA)全流程预测与诊疗辅助系统详细技术方案
  • 前端验证下跨域问题(npm验证)
  • 【前端AI实践】简说AI大模型:AI大模型的基本概念和使用
  • WebFuture 系列产品 15.2.4 发布公告
  • 负载均衡相关基本概念
  • grpc的二进制序列化与http的文本协议对比
  • 【IOS】GCD学习
  • 三大中文wordpress原创主题汉主题
  • VUE组件库开发 八股
  • VsCode 安装 Cline 插件并使用免费模型(例如 DeepSeek)
  • 鸿蒙生态再添翼:身份证银行卡识别引领智能识别技术新篇章
  • AIGC学习笔记(9)——AI大模型开发工程师
  • 组相对策略优化(GRPO):原理及源码解析
  • 从测试角度看待CI/CD,敏捷开发
  • tauri项目绕开plugin-shell直接调用可执行文件并携带任意参数
  • OpenCV C++ 学习笔记(五):颜色空间转换、数值类型转换、图像混合、图像缩放
  • redis数据过期策略
  • 垂起固定翼无人机应用及技术分析
  • [特殊字符] Unity UI 性能优化终极指南 — ScrollRect篇
  • 如何提高工作效率
  • 日语学习-日语知识点小记-构建基础-JLPT-N4阶段(31):そう
  • 第十三章 Java基础-特殊处理
  • 【鸿蒙】HarmonyOS NEXT之如何正常加载地图组件
  • HTTP连接管理——短连接,长连接,HTTP 流水线
  • 常见的七种排序算法 ——直接插入排序