写在前面:最近复习以前学的Mysql索引,又发现迷迷糊糊的了。看了以前的笔记以及好多博客边思考边实践终于打破这城墙了,呜呜呜真感动。不过我发现好多博客不完整,或者有好多错误的,那就当记一下笔记吧,以后来温习温习。本文是在参考博文的理解上做的笔记~
1. 索引是什么?
索引是一种利于快速查询的数据结构,在Mysql中常用的存储引擎是innoDB,innoDB是一种以聚集索引为存储方式。底层的存储方式都是以B+树。
(1)B树简略示意图:
(2)B+树简略示意图:
B树和B+树特点: B树每一个节点都可以存入多个key值,每个节点都存储数据,叶子节点没有指针相连;B+树非叶子节点存储key值,叶子节点存储key和数据,叶子节点包括所有的key,并且按照顺序有指针相连。
为什么选择B+树作为存储结构 : (1)由于从磁盘读取数据到内存是以页为基本单位读取,1页4KB大小。假如我们读取相同大小的数据进入内存,B+树可以读入更多的key进入内存,这样B+树对于B树来说相同索引所建树的高度更矮,对于磁盘IO操作的次数就少。(2)B+树的叶子节点是按照一定顺序的指针指向 所以范围查找效率高。
2. InnoDB聚集索引和普通索引有什么差异?
innoDB的实现中有两大类索引:聚集索引和普通索引(单列索引,联合索引)
InnoDB
聚集索引的叶子节点存储行记录,因此, InnoDB
必须要有,且只有一个聚集索引:
-
如果表定义了
PK
,则PK
就是聚集索引(通常是主键为索引) -
如果表没有定义PK,则第一个
not NULL unique
列是聚集索引; -
否则,
InnoDB
会创建一个隐藏的row-id
作为聚集索引;
所以,聚集索引一定并有且只有一个!!,而普通索引则为自己建立,普通索引的叶子节点存储的不是整行数据而是所有的索引值+主键id,也就是为什么有些情况要用到回表去查找索引之外的值。
3. 回表
回表:如果我们建立了普通索引,我们会进行普通索引的查找;如果查找的字段不在索引字段中(不是索引覆或者主键id),那么我们将会根据普通索引中得到的id去聚集索引中查找所需数据,这就是回表。但索引失效问题例外,索引失效问题下面详细讨论。
4. 索引和联合索引的存储结构
(1)聚簇索引的存储结构(左)和普通索引的存储结构