問題描述
有個朋友給我發來一個問題,說是他們的系統有幾十萬用戶,某個查詢需要 5 秒以上的時間才能返回,同時服務器 CPU 資源占用率將近 100%。這個對于用戶的線上操作影響非常大,那么我們就來看看如何分析和解決這個慢查詢問題。
為了便于說明問題,我們對表結構進行了簡化:
create table customer(
cid int auto_increment primary key,
cname varchar(50) not null,
register_time datetime not null,
recommender varchar(50) character set utf8
) engine=innodb default charset=utf8mb4;
create unique index uk_customer_cname on customer(cname);
insert into customer(cname, register_time, recommender) values('張三', now(), '');
insert into customer(cname, register_time, recommender) values('李四', now(), '張三'),('王五', now(), '李四');
- ? customer 是用戶表,其中 cid 是主鍵;
- ? cname 上有一個唯一索引;
- ? recommender 是用戶的推薦人。
實際查詢涉及了很多表,經過簡化之后存在性能問題的語句如下:
select c.*
from customer c
join customer r on (c.recommender = r.cname )
where r.cid = 1
and c.register_time between now() - interval 1 day and now();
大意是查找通過某人推薦,在指定時間段內注冊的用戶。
問題分析
了解問題之后,首先我讓他給我發來了 explain 執行計劃:
explain
select c.*
from customer c
join customer r on (c.recommender = r.cname )
where r.cname = '張三'
and c.register_time between now() - interval 1 day and now();
id|select_type|table|partitions|type |possible_keys |key |key_len|ref |rows|filtered|Extra |
--|-----------|-----|----------|-----|-----------------|-----------------|-------|-----|----|--------|-----------|
1|SIMPLE |r | |const|uk_customer_cname|uk_customer_cname|202 |const| 1| 100.0|Using index|
1|SIMPLE |c | |ALL | | | | | 3| 33.33|Using where|
從結果可以看出,有一個全表掃描(type = ALL)的操作,顯然這是因為 recommender 字段上缺少索引。
所以,我們首先為 recommender 字段創建了一個索引:
create index idx_customer_cname on customer(recommender);
之后再次查看了執行計劃,結果沒有任何變化,創建的索引沒有生效。然后我們使用了 show warnings 命令看看有沒有更多的信息:
show warnings\\G
*************************** 1. row ***************************
Level: Note
Code: 1003
Message: /* select#1 */ select `hrdb`.`c`.`cid` AS `cid`,`hrdb`.`c`.`cname` AS `cname`,`hrdb`.`c`.`register_time` AS `register_time`,`hrdb`.`c`.`recommender` AS `recommender` from `hrdb`.`customer` `c` join `hrdb`.`customer` `r` where ((`hrdb`.`c`.`register_time` between
這里有一個問題,就是存在字符集轉換:
convert(`hrdb`.`c`.`recommender` using utf8mb4) = '張三')
recommender 需要轉換為 utf8mb4 字符集,查看表結構之后發現它的字符集是 utf8,和表中的其他字段字符集不一樣。原來他們是從之前的版本遷移過來的表結構,不知怎么會導致遺留一個字段的字符集忘記了調整。
MySQL 支持數據庫、表以及字段級別的字符集(Character Set)和排序規則(Collation)。不同字符集支持的字符種類和數量不同,例如 ASCII 字符集只能存儲字母、數字和常見的符號,GB2312 和 GB18030 可以支持中文,Unicode 字符集能夠支持多國語言;排序規則定義了字符的排序順序,例如是否區分大小寫、是否區分重音、中文按照拼音還是偏旁進行排序等。
接下來就是修改字段的字符集了:
alter table customer modify column recommender varchar(50) character set utf8mb4;
然后,再次查看執行計劃的結果如下:
id|select_type|table|partitions|type |possible_keys |key |key_len|ref |rows|filtered|Extra |
--|-----------|-----|----------|-----|------------------|------------------|-------|-----|----|--------|-----------|
1|SIMPLE |r | |const|uk_customer_cname |uk_customer_cname |202 |const| 1| 100.0|Using index|
1|SIMPLE |c | |ref |idx_customer_cname|idx_customer_cname|203 |const| 1| 33.33|Using where|
在實際環境中優化之后的查詢需要 0.1 秒左右,已經完全可以滿足業務的需求了。
總結
本文分析了一個由于字符集不一致,導致增加了索引但是無法使用的案例。通過索引進行查找時需要進行數據的比較,字符集不一致時需要使用 convert 函數進行轉換,從而導致索引失效。通常在遷移遺留系統時需要特別小心,對于 Unicode 推薦使用最新的 utf8mb4 字符集。
-
cpu
+關注
關注
68文章
11038瀏覽量
216035 -
服務器
+關注
關注
13文章
9699瀏覽量
87306 -
MySQL
+關注
關注
1文章
849瀏覽量
27553
發布評論請先 登錄
評論