SQL优化之针对count、表的连接顺序、条件顺序、in及exist的优化__count_select_from_deptno_object_id_

当前位置: 数据库>oracle

SQL优化之针对count、表的连接顺序、条件顺序、in及exist的优化

来源: 互联网发布时间：2014-10-04

本文导语: 本文详述了SQL优化中针对count、表的连接顺序、条件顺序、in及exist的优化，非常具有实用价值！详述如下：一、关于count 看过一些网上关于count(*)和count(列)的文章，count(列)的效率一定比count(*)高吗？其实个人觉得count(*)和count(...

本文详述了SQL优化中针对count、表的连接顺序、条件顺序、in及exist的优化，非常具有实用价值！详述如下：

一、关于count

看过一些网上关于count(*)和count(列)的文章，count(列)的效率一定比count(*)高吗？

其实个人觉得count(*)和count(列)根本就没有可比性，count(*)统计的是表里面的总条数，而count(列)统计的是当列的非空记录条数。

不过我们可以通过实验来比较一下：

首先创建测试表：

drop table test purge;
create table test as select * from dba_objects;

update test set object_id =rownum ;
set timing on 
set linesize 1000
set autotrace on

执行

select count(*) from test;
select count(object_id) from test;

发现耗时是一样的，难道他们的效率其实是一样的吗？

我们在列object_id上创建索引试试看

create index idx_object_id on test(object_id);

然后再执行

select count(*) from test;
select count(object_id) from test;

发现count(object_id)的速度明显比count(*)高出一大截，难道是因为count(object_id)能用到索引，所以效率才提高了很多？

我们再修改下object_id的列属性

alter table test modify object_id not null;

然后再执行

select count(*) from test;
select count(object_id) from test;

发现其实他们的速度是一样快的，count(*)也可用到索引。
其实效率比较的前提是两个语句的写法要等价，这两种写法根本就不等价，因此不具有可比性。

对于oracle优化器来说，我们可以通过实验发现，count不同的列，统计的时间是不一样的，大致趋势是列越靠后，访问的开销越大，列的偏移量决定访问的性能。而count(*)的开销与偏移量无关。因此，在某些场合count(*)反而是最快的。

二、关于in和exist

关于in和exist的说法大都是说in的效率比exist高，所以有in的地方必需得换成exist等等。但是真的是这样的吗？

下面我们来做个试验：

在Oracle 10g中;

select * from dept where deptno NOT IN ( select deptno from emp ) ;
select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我们发现，exist确实比in的效率高啊。这个说法貌似是成立的啊。

但是我们再执行下面的语句

select * from dept where deptno NOT IN ( select deptno from emp where deptno is not null) and deptno is not null;

你会发现加上非空的约束条件后，in和exist的效率是一样的。

查看三个语句的执行计划你就会发现，没有加上非空约束的in语句和exist语句走的都是ANTI半连接算法，所以效率是一样的，而未加非空约束的in语句用的是filter，而不是ANTI算法，所以效率就差一些。

所以我们可以得出结论：在oracle 10g中，如果可以确保非空，则in约束可以用到ANTI的半连接算法，这时候的效率和exist是一样的。

在Oracle 11g中：

select * from dept where deptno NOT IN ( select deptno from emp ) ;
select * from dept where not exists ( select deptno from emp where emp.deptno=dept.deptno) ;

我们发现两个语句的效率是一样的，查看执行计划也是一样的。原来oracle在11g中已经做了优化，所以in和exist的效率是一样的。

由此我们可以得出结论，在11g中，使用in和exist的效率是一样的，因为他们走的都是比较高效的ANTI算法。

三、关于大小表的连接顺序

在网上我们可以看到很多这样的文章，在进行多表查询的时候，用小表或者交叉表做基础表，放在后面，大表放在from后面的位置，因为表的访问顺序是从右往左的。

但是真的是这样的吗？

我们可以做实验验证一下（此处测试环境为 Oracle 11g）：

create table tab_big as select * from dba_objects where rownum

您可能感兴趣的文章:

SQL语句执行顺序图文介绍

sql语句not and or执行顺序(实例解析)

SQL Select语句完整的执行顺序

T-SQL查询语句的执行顺序详解

T-SQL 查询语句的执行顺序解析

SQL Server 查询处理中的各个阶段(SQL执行顺序)示例

有关 sql server 查询的逻辑执行顺序

根据时间范围条件查询数据sql语句

<%@ page language="JAVA" import="Java.sql.*"%> 的条件

sql中count或sum为条件的查询示例(sql查询count)

将string数组转化为sql的in条件用sql查询

有关sql server条件语句之IF应用实例

如何在 SQL SERVER 中快速有条件删除海量数据

有关SQL条件判断语句的二个例子

sql server中多条件组合查询的例子

根据不同的条件查询不同的表的sql代码

SQL中WHERE变量IS NULL条件导致全表扫描问题的解决方法

将所有符合条件的结果拼接成一列并用逗号隔开的一个sql语句

sql 多条件组合查询，并根据指定类别找出所有最小子类别的SQL语句备忘

SQL 复合查询条件(AND,OR,NOT)对NULL值的处理方法

SQL有外连接的时候注意过滤条件位置否则会导致网页慢

本站(WWW.)旨在分享和传播互联网科技相关的资讯和技术，将尽最大努力为读者提供更好的信息聚合和浏览方式。
本站(WWW.)站内文章除注明原创外，均为转载、整理或搜集自网络。欢迎任何形式的转载，转载请注明出处。