Mysql中count(*),DISTINCT的使用方法和效率研究

2007-7-27 23:21

5,672

645 字

4 分钟

本文最后更新于 6885 天前，其中的信息可能已经有所发展或是发生改变。

在处理一个大数据量数据库的时候
突然发现mysql对于count(*)的不同处理会造成不同的结果

比如执行
SELECT count() FROM tablename
即使对于千万级别的数据mysql也能非常迅速的返回结果
而对于
SELECT count() FROM tablename WHERE.....
mysql的查询时间开始攀升

仔细查阅累下手册,发现当没有WHERE语句对于整个mysql的表进行count运算的时候
MyISAM类型的表中保存有总的行数,而当添加有WHERE限定语句的时候Mysql需要对整个表进行检索
从而得出count的数值

突然又想起来看到的不少新兴的php程序对于count的处理并没有很好的意识到这点
记录下

顺便提下mysql的DISTINCT的关键字有很多你想不到的用处
1.在count 不重复的记录的时候能用到
比如SELECT COUNT( DISTINCT id ) FROM tablename;
就是计算talbebname表中id不同的记录有多少条

2,在需要返回记录不同的id的具体值的时候可以用
比如SELECT DISTINCT id FROM tablename;
返回talbebname表中不同的id的具体的值

3.上面的情况2对于需要返回mysql表中2列以上的结果时会有歧义
比如SELECT DISTINCT id, type FROM tablename;
实际上返回的是 id与type同时不相同的结果,也就是DISTINCT同时作用了两个字段，必须得id与tyoe都相同的才被排除了,与我们期望的结果不一样

4.这时候可以考虑使用group_concat函数来进行排除,不过这个mysql函数是在mysql4.1以上才支持的

5.其实还有另外一种解决方式,就是使用
SELECT id, type, count(DISTINCT id) FROM tablename
虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据)
返回的结果是只有id不同的所有结果和上面的4类型可以互补使用,就是看你需要什么样的数据了

PS:
越来越发现有很多细节是需要去探究的,
越来越发现自己写文字真的很杂乱,
有空研究下DISTINCT的效率

bill

19 年前
2007-9-10 13:08:09

谢谢分享。
s7v7nislands

18 年前
2008-1-20 20:19:02

5.其实还有另外一种解决方式,就是使用
SELECT id, type, count(DISTINCT id) FROM tablename
虽然这样的返回结果多了一列无用的count数据(或许你就需要这个我说的无用数据)

SELECT id, type from tablename group by id;
这样貌似也可以

用distinct的时候，如果它有索引，mysql会把它转成group by的方式执行。
Kimi
博主

18 年前
2008-1-21 16:01:50

感谢楼上的又学习了
iranw

14 年前
2012-9-26 14:20:46

谢谢分享
SELECT id, type from tablename group by id;
和
SELECT id, type, count(DISTINCT id) FROM tablename
那个效率高呢？
有测试过吗？
诚易

13 年前
2013-2-01 17:04:07

其实简单的方法最好，一律使用count(*)就可以了。使用0或1什么的，都不是正道。
IT共享导航

10 年前
2016-11-01 10:47:51

IT共享导航学习了，收录了，欢迎来访
http://itdh.boqingbokeji.com
果冻

9 年前
2017-7-06 18:20:12

误导人，第五中方法你试验过么，返回的结果根据就不是你描述的