当前位置:网站首页>MySQL中的基数是啥?
MySQL中的基数是啥?
2022-08-03 15:12:00 【马小屑】
1 基数是啥?
大白话讲:基数指的就是MySQL表中某一列的不同值的数量。
如果这一列是唯一索引,那基数 == 行数。
如果这一列是sex,枚举类型只有男女,那它是基数就是2。
Cardinality越高,列就越有成为索引的价值。MySQL执行计划也会基于Cardinality选择索引。
通过下面的方式可以看到表中各列的基数。

比如这个经典的例子:
有一列为sex,那对于sex列中存储的值来说 非男即女,它的基数最大就是2。
那也就完全没有必要为sex建立索引。因为,为了提升你基于sex的查询速度,MySQL会为你选择的这个新索引创建一棵全新的B+Tree。但你sex只有两种值,对于MySQL来说,即使它为你指定的列建立了B+Tree索引,真正执行查询时,最多进行一次二分查询,剩下的操作只能是遍历,所以为sex创建索引意义不大。
2 InnoDB更新基数的时机?
参数:innodb_stats_auto_recalc控制MySQL是否主动重新计算这些持久性的信息。默认为1表示true、0表示false。默认情况下当表中的行变化超过10%时,重新计算基数信息。
3 基数是估算出来的!
基数并不会实时更新!而且它是通过采样估算出来的值!至于基数的公式是怎样的,可能并不重要。重要的是你得知道,它是通过随机采样数据页的方式统计出来的一个估算值。而且随机采样的页数可以通过参数:
innodb_stats_persistent_sample_pages 设置,默认值是20。
这就意味着 基数值并不准确,甚至你每次计算的结果相差还是蛮大的。
4 基数的持久化机制
可以通过参数innodb_stats_persistent 控制是否持久化基数,默认为off。
当然你可以为一个单独的表设置 STATS_PERSISTENT=1 那么它的
innodb_stats_persistent将自动被启用。
开启它的好处是:重启MySQL不会再重复计算这个值,加快重启速度。
5 如何主动的更新基数?
执行下面的SQL时都会触发InnoDB更新基数(即使你并没有意识到它会更新基数)。所以尽量选择一个业务低峰期。
analyze table tableName;

如果因为采样的数量太少了,计算的基数就错的离谱。那很可能会导致MySQL的优化器选错索引。这时你可以将这个值适当调大。但是增加太多可能会导致ANALYZE TABLE运行缓慢。
反之, ANALYZE TABLE 运行太慢。你可以适度调整参数innodb_stats_persistent_sample_pages 的值。但是这又可能导致基数计算的不准确。
如果没有办法平衡两者的关系。可以考虑减少表中索引列的数量或限制分区的数量以降低 ANALYZE TABLE复杂性。表的主键中的列数也很重要,因为主键列被附加到每个非唯一索引中。
边栏推荐
- 问题5:发现缺陷怎么办?缺陷的类型有哪些?
- 问题1:批量测试(正式测试)之前应该怎么做?
- 实习路途:记录给我的第一个实习项目中的困惑
- 问题1:get和post的区别
- 2021年12月电子学会图形化二级编程题解析含答案:绘制多边形
- 2021年12月电子学会图形化三级编程题解析含答案:数星星
- 又有大厂员工连续加班倒下/ 百度搜狗取消快照/ 马斯克生父不为他骄傲...今日更多新鲜事在此...
- 随笔-Unity中一个简易的Spine动画控制器
- 2022年镇海夏令营组合数学和数论班 —— 数学作业 1
- A high-performance creation book, ASUS Dreadnought Pro15 2022 is completely enough for daily photo editing and editing!
猜你喜欢

How to use redis
![Detailed explanation of cloud hard disk EVS and how to use and avoid pits [HUAWEI CLOUD is simple and far]](/img/95/c05f184a6221fefaaa93beb9dccc33.png)
Detailed explanation of cloud hard disk EVS and how to use and avoid pits [HUAWEI CLOUD is simple and far]

2021年12月电子学会图形化三级编程题解析含答案:数星星

实习路途:记录给我的第一个实习项目中的困惑

2021年12月电子学会图形化四级编程题解析含答案:棕熊大战

2021年12月电子学会图形化四级编程题解析含答案:新冠疫苗接种系统

在北极都可以穿短袖了,温度飙升至32.5℃

理解string类

Controller层代码这么写,简洁又优雅!

又有大厂员工连续加班倒下/ 百度搜狗取消快照/ 马斯克生父不为他骄傲...今日更多新鲜事在此...
随机推荐
程序员面试必备PHP基础面试题 – 第十九天
PAT乙级-B1011 A+B 和 C(15)
自己悦表存心
STL简介
苹果开发「AI 建筑师」GAUDI:根据文本生成超逼真 3D 场景!
分布式系统与微服务的区别
未来无法预料
【实战】Next.js + 云函数开发一个面试刷题网站
Detailed explanation of cloud hard disk EVS and how to use and avoid pits [HUAWEI CLOUD is simple and far]
MySQL性能优化的'4工具+10技巧'
彻底搞懂云桌面配置及实践踩坑【华为云至简致远】
夜神浏览器fiddler抓包
MySQL面试必备(一)基础篇
PAT乙级-B1017 A除以B(20)
web漏洞之远程命令/代码执行
Several methods of installing Mysql in Linux
HDU 1406 (完数)
一次做数据报表的踩坑经历,让我领略了数据同步增量和全量的区别
问题7:功能测试花瓶用例
Day1:面试必考真题