SQLSERVER的非聚集索引结构深度理解
本文导语: 我们知道SQLSERVER的数据行的存储有两种数据结构:A: 堆 B :B树(binary 二叉树) 数据按照这种两种的其中一种来排序和存储,学过数据结构的朋友应该知道二叉树,为什麽用二叉树,因为方便用二分查找法来快速 找到数据...
我们知道SQLSERVER的数据行的存储有两种数据结构:A: 堆 B :B树(binary 二叉树)
数据按照这种两种的其中一种来排序和存储,学过数据结构的朋友应该知道二叉树,为什麽用二叉树,因为方便用二分查找法来快速
找到数据。如果是堆,那么数据是不按照任何顺序排序的,也没有任何结构,数据页面也不是首尾相连的,不像B树,数据页面
使用双向链表首尾相连。堆表只依靠表里的IAM页(索引分配映射页)将堆的页面联系在一起,IAM里记录了页面编号,页面位置
除非表里有聚集索引,如果没有的话那么表里的数据的存储就是堆结构
那么非聚集索引呢?非聚集索引也是堆结构?其实SQLSERVER有几种页面类型(数据都使用一页一页来存储,就像Windows的内存也是使用页面来组织的)
其中有一种是索引页 ,一种是数据页
我感觉很多书都说不清,就像我一样,在文章的开头也是这样说的:数据行的存储有两种数据结构:A: 堆 B :B树(二叉树)
我觉得应该是数据页面的存储有两种数据结构:1、堆 2、B树
先说一下:索引页,不管是聚集索引还是非聚集索引,这些索引数据都存放在索引页,而索引页都是按照B树的结构里存储的
而堆页:也就是实际的数据行,如果表里没有聚集索引,那么实际的数据就放在堆页,如果聚集索引,那么数据就放在索引页
而B树里的节点 ,其实又叫页面,又叫节点 在B树里会有一页:root page(亦即是根节点),非聚集索引和聚集索引都是一样的
所以:数据行的存储有两种数据结构:A: 堆 B :B树(二叉树)
上面这句话应该明白了吧?
在说一下,在堆里的数据页面完全是随机存放的,而数据页面之间唯一的逻辑连接是记录在IAM页里的,所以IAM页也就扮演了root page的角色
那么聚集索引呢?聚集索引也是堆结构?
非聚集索引放在索引页,B树结构,数据依旧放在堆页,那么如果数据页放在堆里,不像聚集索引放在B树的叶子节点里
(亦即是放在索引页里),那么非聚集索引和实际的数据如何发生联系呢?
答案是:在非聚集索引的叶子节点(叶子页面)会有行定位器,而行定位器的作用请看下面红色字
非聚集索引与聚集索引具有相同的B树结构,他们之间的显著差别在于以下两点:
(1)基础表的数据行不按非聚集键的顺序排序和存储
(2)非聚集索引的叶层是由索引页而不是由数据页组成
(3)建立非聚集索引的表可以是一个B树,也可以是一个堆
(4)如果表是堆(意味着该表没有聚集索引),行定位器指向行的指针。该指针是由文件标识符ID:页码:页上的行数生成。整个
指针称为行ID(RID)
(5)如果表有聚集索引或索引视图上有聚集索引,则行定位器会指向聚集索引键。SQL通过使用存储在非聚集索引的叶子内的
指针(指向聚集索引键)搜索聚集索引来检索实际数据
非聚集索引不会改变或改善实际数据页的存储模式。他的B树结构只针对自己的索引页面。
不过,非聚集索引跟聚集索引的作用还是一样的,相当于检字表
最后总结一下吧,这麽短的随笔总结啥子呢?
当然是总结表的结构,因为曾经有人在论坛里问过一张表的结构
A 有聚集索引的表或者有聚集索引也有非聚集索引 (B树)
B 没有任何索引(堆)
C 没有聚集索引,有非聚集索引(B树+堆)
论坛里有人简称A为聚集表 ,B和C为堆表
记得以前在大学里数据结构老师讲过的一些数据结构:大根堆 ,小根堆 ,双向链表,二叉树
可惜现在全部还给老师了
附上图片
堆表的结构
非聚集索引的结构
聚集索引的结构