Wednesday, September 8, 2010

MySQL性能优化4 - 分析 SQL 执行计划

通过以上步骤查询到效率低的 SQL 语句 后,可以通过 [cci lang="mysql"]EXPLAIN[/cci] 或者 [cci lang="mysql"]DESC[/cci] 命令获取 MySQL 如何执行 [cci lang="mysql"]SELECT[/cci] 语句的信息,包括在 [cci lang="mysql"]SELECT[/cci] 语句执行过程中表如何连接和连接的顺序,比如我们想计算 2006 年所有公司的销售额,需要关联 sales 表和 company 表,并且对 profit 字段做求和[cci lang="mysql"](sum)[/cci]操作,相应 SQL 的执行计划如下:

[cc lang="mysql"]
mysql> explain select sum(profit) from sales a,company b where a.company_id = b.id and a.year = 2006\G;

*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: a
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 12
Extra: Using where

*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: b
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 12
Extra: Using where

2 rows in set (0.00 sec)
[/cc]

每个列的解释如下:

  • select_type :表示 SELECT 的 类型,常见的取值有 SIMPLE (简单表,即不使用表连接或者子查询)、 PRIMARY (主查询,即外层的查询)、 UNION ( UNION 中的第二个或者后面的查询语句)、 SUBQUERY (子查询中的第一个 SELECT )等。

  • table :输出结果集的表。

  • type :表示表的连接类型,性能由好到差的连接类型为 system (表中仅有一行,即常量表)、 const (单表中最多有一个匹配行,例如 primary key 或者 unique index )、 eq_ref (对于前面的每一行,在此表中只查询一条记录,简单来说,就是多表连接中使用 primary key 或者 unique index )、 ref (与 eq_ref 类似,区别在于不是使用 primary key 或者 unique index ,而是使用普通的索引)、 ref_or_null ( 与 ref 类似,区别在于条件中包含对 NULL 的查询 ) 、 index_merge ( 索引合并优化 ) 、 unique_subquery ( in 的后面是一个查询主键字段的子查询)、 index_subquery ( 与 unique_subquery 类似,区别在于 in 的后面是查询非唯一索引字段的子查询)、 range (单表中的范围查询)、 index (对于前面的每一行,都通过查询索引来得到数据)、 all (对于前面的每一行,都通过全表扫描来得到数据)。

  • possible_keys :表示查询时,可能使用的索引。

  • key :表示实际使用的索引。

  • key_len :索引字段的长度。

  • rows :扫描行的数量。

  • Extra :执行情况的说明和描述。


在上面的例子中,已经可以确认是 对 a 表的全表扫描导致效率的不理想,那么 对 a 表的 year 字段创建索引,具体如下:

[cc lang="mysql"]mysql> create index idx_sales_year on sales(year);
Query OK, 12 rows affected (0.01 sec)
Records: 12 Duplicates: 0 Warnings: 0[/cc]

创建索引后,这条语句的执行计划如下:
[cc lang="text"]
mysql> explain select sum(profit) from sales a,company b where a.company_id = b.id and a.year = 2006\G;

*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: a
type: ref
possible_keys: idx_sales_year
key: idx_sales_year
key_len: 4
ref: const
rows: 3
Extra:

*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: b
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 12
Extra: Using where

2 rows in set (0.00 sec)
[/cc]

可以发现建立索引后对 a 表需要扫描的行数明显减少(从全表扫描减少到 3 行),可见索引的使用可以大大提高数据库的访问速度,尤其在表很庞大的时候这种优势更为明显,使用索引优化 sql 是优化问题 sql 的一种常用基本方法,在后面的章节中我们会具体介绍如何使索引来优化 sql 。

No comments:

Post a Comment