提高SQL Server性能的3个关键点(2)

　　对于多列索引，SQL Server维持一个在所有列的索引上的密度统计(用于联合)和在第一个索引上的

　　histogram(柱状图)统计。根据统计结果，如果在复合索引上的第一个索引很少被选择使用，那么优化器对很多查询请求将不会使用索引。

　　有用的索引会提高select语句的性能，包括insert,uodate,delete。

　　但是，由于改变一个表的内容，将会影响索引。每一个insert,update,delete语句将会使性能下降一些。实验表明，不要在一个单表上用大量的索引，不要在共享的列上(指在多表中用了参考约束)使用重叠的索引。

　　在某一列上检查唯一的数据的个数，比较它与表中数据的行数做一个比较。这就是数据的选择性，这比较结果将会帮助你决定是否将某一列作为侯选的索引列，如果需要，建哪一种索引。你可以用下面的查询语句返回某一列的不同值的数目。

以下是代码片段：
select count(distinct cloumn_name) from table_name

　　假设column_name是一个10000行的表，则看column_name返回值来决定是否应该使用，及应该使用什么索引。

以下是代码片段：
Unique values Index
　　5000 Nonclustered index
　　20 Clustered index
　　3 No index

　　镞索引和非镞索引的选择

　　<1>镞索引是行的物理顺序和索引的顺序是一致的。页级，低层等索引的各个级别上都包含实际的数据页。一个表只能是有一个镞索引。由于update,delete语句要求相对多一些的读操作，因此镞索引常常能加速这样的操作。在至少有一个索引的表中，你应该有一个镞索引。

　　在下面的几个情况下，你可以考虑用镞索引：

　　例如：某列包括的不同值的个数是有限的(但是不是极少的)

　　顾客表的州名列有50个左右的不同州名的缩写值，可以使用镞索引。

　　例如：对返回一定范围内值的列可以使用镞索引，比如用between,>,>=,<,<=等等来对列进行操作的列上。

以下是代码片段：
select * from sales where ord_date between '5/1/93' and '6/1/93'

　　例如：对查询时返回大量结果的列可以使用镞索引。

以下是代码片段：
SELECT * FROM phonebook WHERE last_name = 'Smith'

　　当有大量的行正在被插入表中时，要避免在本表一个自然增长(例如，identity列)的列上建立镞索引。如果你建立了镞的索引，那么insert的性能就会大大降低。因为每一个插入的行必须到表的最后，表的最后一个数据页。

　　当一个数据正在被插入(这时这个数据页是被锁定的)，所有的其他插入行必须等待直到当前的插入已经结束。

　　一个索引的叶级页中包括实际的数据页，并且在硬盘上的数据页的次序是跟镞索引的逻辑次序一样的。

　　<2>一个非镞的索引就是行的物理次序与索引的次序是不同的。一个非镞索引的叶级包含了指向行数据页的指针。

　　在一个表中可以有多个非镞索引，你可以在以下几个情况下考虑使用非镞索引。

　　在有很多不同值的列上可以考虑使用非镞索引

　　例如：一个part_id列在一个part表中

以下是代码片段：
select * from employee where emp_id = 'pcm9809f'

　　查询语句中用order by 子句的列上可以考虑使用镞索引

(责任编辑：ken)