当前位置:网站首页>咱们500万条数据测试一下,如何合理使用索引加速?
咱们500万条数据测试一下,如何合理使用索引加速?
2022-08-04 00:05:00 【博学谷狂野架构师】
5 如何合理使用索引加速
tips:
500万条建表sql参照网盘sql脚本
[[email protected] bin]# ./mysql -u root -p itcast < product_list-5072825.sql
索引是数据库优化最常用也是最重要的手段之一, 通过索引通常可以帮助用户解决大多数的MySQL的性能优化问题。
5.1 验证索引提升查询效率
在我们准备的表结构product_list 中, 一共存储了 500多万记录;
mysql> select count(1) from product_list;
+----------+
| count(1) |
+----------+
| 5072825 |
+----------+
1 row in set (1.71 sec)
mysql>
1) 根据ID查询
SELECT * FROM product_list WHERE id = 121926;
查询速度很快, 接近0s , 主要的原因是因为id为主键, 有索引;
2). 根据store_name进行精确查询
执行用时4分钟
SELECT * FROM product_list WHERE store_name = '联想北达兴科专卖店';
查看SQL语句的执行计划 :
explain SELECT * FROM product_list WHERE store_name = '联想北达兴科专卖店';
处理方案 , 针对store_name字段, 创建索引 :
create index product_list_stname on product_list(store_name);
索引创建完成之后,再次进行查询 :
SELECT * FROM product_list WHERE store_name = '联想北达兴科专卖店';
通过explain , 查看执行计划,执行SQL时使用了刚才创建的索引
-- 查看SQL语句的执行计划
explain SELECT * FROM product_list WHERE store_name = '联想北达兴科专卖店';
5.2 索引的使用
5.2.1 准备环境
create table `tb_seller` (
`sellerid` varchar (100),
`name` varchar (100) not null,
`nickname` varchar (50),
`password` varchar (60),
`status` varchar (1) not null,
`address` varchar (100) not null,
`createtime` datetime,
primary key(`sellerid`)
)engine=innodb default charset=utf8;
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('alibaba','阿里巴巴','阿里小店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('baidu','百度科技有限公司','百度小店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('huawei','华为科技有限公司','华为小店','e10adc3949ba59abbe56e057f20f883e','0','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('itcast','传智播客教育科技有限公司','传智播客','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('itheima','黑马程序员','黑马程序员','e10adc3949ba59abbe56e057f20f883e','0','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('luoji','罗技科技有限公司','罗技小店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('oppo','OPPO科技有限公司','OPPO官方旗舰店','e10adc3949ba59abbe56e057f20f883e','0','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('ourpalm','掌趣科技股份有限公司','掌趣小店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('qiandu','千度科技','千度小店','e10adc3949ba59abbe56e057f20f883e','2','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('sina','新浪科技有限公司','新浪官方旗舰店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('xiaomi','小米科技','小米官方旗舰店','e10adc3949ba59abbe56e057f20f883e','1','西安市','2088-01-01 12:00:00');
insert into `tb_seller` (`sellerid`, `name`, `nickname`, `password`, `status`, `address`, `createtime`) values('yijia','宜家家居','宜家家居旗舰店','e10adc3949ba59abbe56e057f20f883e','1','北京市','2088-01-01 12:00:00');
create index idx_seller_name_sta_addr on tb_seller(name,status,address);
5.2.2 避免索引失效
组合索引(name,status,address)
1) 全值匹配
对索引中所有列都指定具体值。
-- 全值匹配
explain select * from tb_seller where name='小米科技' and status='1' and address='北京市';
ken_len = 3 * N + 2;
-- name varchar(100) ==302
-- status varchar(1) ==5
-- address varchar(100) ==302
2) 最左前缀法则
如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始,并且不跳过索引中的列。
匹配最左前缀法则,走索引:
explain select * from tb_seller where name='小米科技';
违反最左前缀法则 , 索引失效:
explain select * from tb_seller where status='1';
explain select * from tb_seller where status='1' and address='北京市';
如果符合最左法则,但是出现跳跃某一列,只有最左列索引生效:
explain select * from tb_seller where name='小米科技' and address='北京市';
3) 范围查询右边的列
-- 使用范围查询的情况,右边的列失效
explain select * from tb_seller where name='小米科技' and status='1' and address='北京市';
explain select * from tb_seller where name='小米科技' and status>'1' and address='北京市';
根据前面的两个字段name , status 查询是走索引的, 但是最后一个条件address 没有用到索引。
4) 禁止列运算
-- 不要在索引列上进行运算操作, 索引将失效。
explain select * from tb_seller where substring(name,3,2) ='科技';
5) 字符串不加单引号
造成索引失效。
-- 字符串不加单引号,造成索引失效。
explain select * from tb_seller where name='科技' and status='0';
explain select * from tb_seller where name='科技' and status=0;
由于,在查询时,没有对字符串加单引号,MySQL的查询优化器,会自动的进行类型转换,造成索引失效。
6) 尽量使用覆盖索引
避免select *
尽量使用覆盖索引(只访问索引的查询(索引列完全包含查询列)),减少select * 。
-- 尽量使用覆盖索引
explain select * from tb_seller where name='科技' and status='0' and address='西安市';
explain select name from tb_seller where name='科技' and status='0' and address='西安市';
explain select name ,status from tb_seller where name='科技' and status='0' and address='西安市';
explain select name ,status,address from tb_seller where name='科技' and status='0' and address='西安市';
如果查询列,超出索引列,也会降低性能。
explain select status,address ,password from tb_seller where name='科技' and status='0' and address='西安市';
TIP :
using index :使用覆盖索引的时候就会出现
using where:在查找使用索引的情况下,需要回表去查询所需的数据
using index condition:查找使用了索引,但是需要回表查询数据
using index ; using where:查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据
7) 合理使用or条件
用or分割开的条件, 如果or前的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
示例,name字段是索引列 , 而createtime不是索引列,中间是or进行连接是不走索引的 :
explain select * from tb_seller where name='黑马程序员' or createtime = '2088-01-01 12:00:00';
8) 合理使用like查询
以%开头的Like模糊查询,索引失效。
-- 如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
explain select * from tb_seller where name like '黑马程序员%';
explain select * from tb_seller where name like '%黑马程序';
explain select * from tb_seller where name like '%黑马程序员%';
解决方案 : 通过覆盖索引来解决
explain select sellerid from tb_seller where name like '%科技%';
explain select sellerid,name from tb_seller where name like '%科技%';
explain select sellerid,name,status,address from tb_seller where name like '%科技%';
9) 合理评估索引执行
如果MySQL评估使用索引比全表更慢,则不使用索引。
-- 如果MySQL评估使用索引比全表更慢,则不使用索引。
create index idx_seller_addr on tb_seller(address);
explain select * from tb_seller where address='北京市';
explain select * from tb_seller where address='西安市';
10) is NULL和 is NOT NULL
有时索引失效。
-- is NULL和 is NOT NULL
explain select * from tb_seller where name is null;
explain select * from tb_seller where name is not null;
解决方案:把null值设置一个默认值
11) in和not in
in 走索引, not in 索引失效。
-- in 走索引, not in 索引失效。
explain select * from tb_seller where sellerid in('oppo','xiaomi','sina');
explain select * from tb_seller where sellerid not in ('oppo','xiaomi','sina');
12) 单列索引和复合索引
尽量使用复合索引,而少使用单列索引 。
创建复合索引
create index idx_name_sta_address on tb_seller(name, status, address);
就相当于创建了三个索引 :
name
name + status
name + status + address
创建单列索引
create index idx_seller_name on tb_seller(name);
create index idx_seller_status on tb_seller(status);
create index idx_seller_address on tb_seller(address);
数据库会选择一个最优的索引(辨识度最高索引)来使用,并不会使用全部索引 。
5.3 查看索引使用情况
show status like 'Handler_read%';
show global status like 'Handler_read%';
mysql> show status like 'Handler_read%';
+-----------------------+---------+
| Variable_name | Value |
+-----------------------+---------+
| Handler_read_first | 18 |
| Handler_read_key | 19 |
| Handler_read_last | 0 |
| Handler_read_next | 5072825 |
| Handler_read_prev | 0 |
| Handler_read_rnd | 0 |
| Handler_read_rnd_next | 269 |
+-----------------------+---------+
7 rows in set (0.02 sec)
mysql>
Handler_read_first:索引中第一条被读的次数。如果较高,表示服务器正执行大量全索引扫描(这个值越低越好)。
Handler_read_key:如果索引正在工作,这个值代表一个行被索引值读的次数,如果值越低,表示索引得到的性能改善不高,因为索引不经常使用(这个值越高越好)。
Handler_read_next :按照键顺序读下一行的请求数。如果你用范围约束或如果执行索引扫描来查询索引列,该值增加。
Handler_read_prev:按照键顺序读前一行的请求数。该读方法主要用于优化ORDER BY ... DESC。
Handler_read_rnd :根据固定位置读一行的请求数。如果你正执行大量查询并需要对结果进行排序该值较高。你可能使用了大量需要MySQL扫描整个表的查询或你的连接没有正确使用键。这个值较高,意味着运行效率低,应该建立索引来补救。
Handler_read_rnd_next:在数据文件中读下一行的请求数。如果你正进行大量的表扫描,该值较高。通常说明你的表索引不正确或写入的查询没有利用索引。
专注Java技术干货分享,欢迎志同道合的小伙伴,一起交流学习
边栏推荐
猜你喜欢
初始 List 接口
(PC+WAP)织梦模板不锈钢类网站
七夕活动浪漫上线,别让网络拖慢和小姐姐的开黑时间
汉字风格迁移---结合本地和全局特征学习的中文字体迁移
代码重构:面向单元测试
【MySQL —— 索引】
Why Flutter Flutter of tutorials is the best choice for business?
Using matlab to solve the linear optimization problem based on matlab dynamic model of learning notes _11 】 【
689. 三个无重叠子数组的最大和
ES6高级-迭代器与生成器的用法
随机推荐
Creo9.0 绘制中心线
小身材有大作用——光模块寿命分析(二)
全面讲解 Handler机制原理解析 (小白必看)
响应式织梦模板除尘器类网站
boot issue
LeetCode 0155. 最小栈
国内首发可视化智能调优平台,小龙带你玩转KeenTune UI
V8中的快慢数组(附源码、图文更易理解)
Jmeter-参数化
2022/8/3 Exam Summary
After building the pytorch environment, the pip and conda commands cannot be used
第1章:初识数据库与MySQL----MySQL安装
2023年航空航天、机械与机电工程国际会议(CAMME 2023)
智能管理PoE交换机
ping数据包中的进程号
LeetCode 19:删除链表的倒数第 N 个结点
一文搞定 SQL Server 执行计划
libnet
V8中的快慢数组(附源码、图文更易理解)
Nanoprobes Mono- Sulfo -NHS-Nanogold的使用和应用