MYSQL中为什么索引不宜建在重复数据多的列上

本文探讨了数据库索引的使用及其对查询性能的影响,分析了在不同情况下,如性别字段全为男时,建立索引可能带来的额外时间消耗。对比了MyISAM和InnoDB两种存储引擎的索引处理方式,解释了InnoDB中聚簇索引和非聚簇索引的工作原理。

昨天想了一天这个问题

首先我们先粗略的说一说:

加入有一个查询语句要查询性别为男生的数据,因为这样的数据很多,我们要扫描很多次索引,然后再去取这个性别为男的数据。

那么分为两部分,先扫描索引,然后去取这个符合要求的数据

如果我们不建立索引,那么去扫描整个表。

不建立索引需要的时间=T扫描整个表                            建立索引需要的时间= T去索引中取+T取相应的数据条件 

我们去考虑一种极限,如果性别全为男,那么我们建立索引去查找的时间就是T扫描整个索引表+T扫描整个表。那么耗时肯定过大了。所以得出我们的结论

我们在通过innodb和MyISAM来细说

MyISAm中:就是类似于上面的描述,需要先去扫描索引树,再去扫描表。

 

 

Innodb中:它的索引和数据在一起,它的非聚簇索引中保留了当前列和主键列的索引,每次查还要去主键索引查找整个信心,因为主键的索引是包含所有节点信息的,那么非聚簇索引向聚簇索引转换时就会出现问题时间消耗,如同上面的情况。

有人可能会问,如果放在聚簇索引上查找重复多个列,那不就没关系了,问题是聚集索引是唯一的,不能重复

 

关于索引的存储结构:

https://www.cnblogs.com/zlcxbb/p/5757245.html

https://www.cnblogs.com/weizhixiang/p/5914120.html

这两篇文章都不错,不过我觉得第一篇写的更好。

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值