Oracle总共只有两种基本的数据访问途径:全扫描或者索引扫描 。
统计信息在优化器准备确定最优方法的过程中扮演了关键的角色。
当对一个对象进行全扫描时,与该对象相关的所有数据块都必须取出并进行处理,以确定块中所包含的数据行是否是你的查询所需要的。请记住Oracle必须将整个数据块读取到内存中以取得这个块中所存储的数据行的数据。因此,当发生全扫描时,实际上优化器需要考虑两件事:必须读取多少数据块以及每个数据块中有多少数据将被舍弃。
基于数据存储方式的不同,优化器的执行计划选择也可能会不同。
请记住,全扫描是否为高效的选择,取决于需要访问的数据块个数以及最终的结果集行数。数据的存储方式在决策过程中扮演了重要的角色。此外,全扫描是否为高效选择的另一个关键因素是舍弃。所访问数据块数目以及舍弃的数量越大,全表扫描的成本也就越高。
随着时间的推移,新的行被插入到表中使得表变得更大,舍弃这么多数据行的成本也不断增加,到一定程度时优化器将会切换到使用索引扫描运算。优化器决定进行切换的点并不一定是你实现最佳性能的点。你可以通过使用提示来强制优化器使用索引,以测试在哪个点上使用索引更有意义。
全扫描运算将会进行多块读取。也就是说一个单独的IO调用将会请求多个块而不仅仅是一个。所请求的数据块数目是可变的,实际上可以是从一个到db_file_multiblock_read_count参数所指定的数目范围之间的任意个。例如,如果这个参数设定为16,而表中有160个块,可以只通过10次调用就可以获取所有的数据块。
关于全表扫描需要注意的最后一点,当对扫描进行多块读取调用时,Oracle将最多读取到位于表中高水位线的数据块。高水位线标出了最后一块有数据写入的数据块。即使几乎所有数据行都被删除了并且一些块实际上已经完全变成空的了,高水位线还是保持不变。当进行全扫描运算的时候,到高水位线为止的所有数据块都将被读取并扫描,即使它们是空的。这就意味着许多实际上不需要读取的空数据块也被读取了。