一分钟了解聚集索引,非聚集索引,联合索引,索引覆盖

赞赏 2017-07-05

本文带你了解聚集索引,非聚集索引,联合索引,索引覆盖


举例,业务场景,用户表,表结构为:

t_user(
uid primary key,
login_name unique,
passwd,
login_time,
age,
…
);

 

聚集索引(clustered index)

聚集索引决定数据在磁盘上的物理排序,一个表只能有一个聚集索引,一般用primary key来约束。

举例:t_user场景中,uid上的索引


非聚集索引(non-clustered index)

它并不决定数据在磁盘上的物理排序,索引上只包含被建立索引的数据,以及一个行定位符row-locator,这个行定位符,可以理解为一个聚集索引物理排序的指针,通过这个指针,可以找到行数据。

举例,查找年轻MM的业务需求:

select uid from t_user where age > 18 and age < 26;

age上建立的索引,就是非聚集索引。


联合索引

多个字段上建立的索引,能够加速复核查询条件的检索

举例,登录业务需求:

select uid, login_time from t_user where login_name=? and passwd=?

可以建立(login_name, passwd)的联合索引。

联合索引能够满足最左侧查询需求,例如(a, b, c)三列的联合索引,能够加速a | (a, b) | (a, b, c) 三组查询需求。

这也就是为何不建立(passwd, login_name)这样联合索引的原因,业务上几乎没有passwd的单条件查询需求,而有很多login_name的单条件查询需求。

 

提问

select uid, login_time from t_user where passwd=? and login_name=?

能否命中(login_name, passwd)这个联合索引?

回答:可以最左侧查询需求,并不是指SQL语句的写法必须满足索引的顺序(这是很多朋友的误解)


索引覆盖

被查询的列,数据能从索引中取得,而不用通过行定位符row-locator再到row上获取,即“被查询列要被所建的索引覆盖”,这能够加速查询速度。

举例,登录业务需求:

select uid, login_time from t_user where login_name=? and passwd=?

可以建立(login_name, passwd, login_time)的联合索引,由于login_time已经建立在索引中了,被查询的uidlogin_time就不用去row上获取数据了,从而加速查询。

 

末了多说一句,登录这个业务场景,login_name具备唯一性,建这个单列索引就好。


作业

假设订单有三种状态0已下单,1已支付,2已完成

业务需求,查询未完成的订单,哪个SQL更快呢?

  1.  select * from order where status!=2

  2.  select * from order where status=0 or status=1

  3.  select * from order where status IN (0,1)

  4.  select * from order where status=0 union select * from order where stauts=1

实际业务,一般有多个状态,“索引区分度法则”:辨识度超过20%的属性,如果有查询需求,就建议建立索引(这个case举例用的3个状态,只是举例)



结论:方案1最慢,方案2,3,4都能命中索引


但是... 


一:union all 肯定是能够命中索引的

select * from order where status=0

union all

select * from order where status=1

说明:

  • 直接告诉MySQL怎么做,MySQL耗费的CPU最少

  • 程序员并不经常这么写SQL(union all)


二:简单的 in 能够命中索引

select * from order where status in (0,1)

说明:

  • 让MySQL思考,查询优化耗费的cpu比union all多,但可以忽略不计

  • 程序员最常这么写SQL(in),这个例子,最建议这么写

 

三:对于or,新版的MySQL能够命中索引

select * from order where status=0 or status=1

说明:

  • 让MySQL思考,查询优化耗费的cpu比in多,别把负担交给MySQL

  • 不建议程序员频繁用or,不是所有的or都命中索引

  • 对于老版本的MySQL,建议查询分析下



四、对于 !=,负向查询肯定不能命中索引

select * from order where status!=2

说明:

  • 全表扫描,效率最低,所有方案中最慢

  • 禁止使用负向查询

 

五、其他方案

select * from order where status < 2

这个具体的例子中,确实快,但是:

  • 这个例子只举了3个状态,实际业务不止这3个状态,并且状态的“值”正好满足偏序关系,万一是查其他状态呢,SQL不宜依赖于枚举的值,方案不通用

  • 这个SQL可读性差,可理解性差,可维护性差,强烈不推荐


登陆后阅读全文
阅读 2983 赞赏 0 有用 10 没用 2 收藏 1 分享

   



0 条留言

ESTRELA的头像

ESTRELA

架构师之路

有料推荐

这世界欠我一个这样的老公!

高校学生模仿“世界名画”摆拍,可以说是戏精本精了

iPhone X 跌破发行价,苏宁200亿入股恒大 | 财经日日评

果然是高手!这次在日本,特朗普竹杠敲得不是一般狠

资深黄牛现身说法:iPhone X价格秒变不停,就像炒股一样

长一样的双胞胎也能识别?蚂蚁金服发布「眼纹识别」技术

苏联是怎么被阿富汗拖垮的?

美团或入局「分时租赁」共享汽车,王兴要大笔投入「泛出行」领域了? | 36氪独家

你或许被“一盘番茄炒蛋”刷屏了,但有人辛酸,有人质疑

iPhone X发售前夜,黄牛与苹果公司的不安

他的文章

漫画:如何破解MD5算法?

漫画:什么是MD5算法?

Node也许不是构建大型服务的最佳选择——Node之父Ryan Dahl访谈录

7个有益的编程习惯

58技术部线上操作与线上问题排查实战

不看任何数学公式的情况下理解傅里叶分析

多对多业务,数据库水平切分架构一次搞定

没想到,从人工智能手上救下愚蠢的人类的,竟然是.... 验证码???

或许你不知道的10条SQL技巧((sql 优化 sql索引优化))

怎样才能生成一亿个不重复的随机数 | 算法

手机扫一扫
分享文章