警惕 MySql 更新 sql 的 WHERE 从句中的 IN, 子查询时出现的性能陷阱

以下文章来源:https://blog.csdn.net/defonds/article/details/46745143

mer_stage 表有 216423 条记录,DDL:

CREATE TABLE `mer_stage` (

`STAGE_ID` int(11) NOT NULL AUTO_INCREMENT,

`MER_ID` int(11) NOT NULL,

`MER_CODE` varchar(16) DEFAULT NULL,

`MER_NAME` varchar(80) NOT NULL,

`INS_CODE` varchar(16) NOT NULL,

`INS_NAME` varchar(64) DEFAULT NULL,

`AGENT_CODE` varchar(16) DEFAULT NULL,

`AGENT_NAME` varchar(64) DEFAULT NULL,

`BIG_CATEGORY_NAME` varchar(32) DEFAULT NULL,

`SUB_CATEGORY_CODE` char(4) DEFAULT NULL,

`SUB_CATEGORY_NAME` varchar(64) DEFAULT NULL,

`LICENSE_CODE` varchar(64) DEFAULT NULL,

`LICENSE_NAME` varchar(64) DEFAULT NULL,

`SHORT_NAME` varchar(25) DEFAULT NULL,

`MER_STATUS` tinyint(4) DEFAULT NULL,

`PROVINCE_NAME` varchar(16) DEFAULT NULL,

`CITY_CODE` char(4) DEFAULT NULL,

`CITY_NAME` varchar(12) DEFAULT NULL,

`REGISTER_ADDRESS` varchar(128) DEFAULT NULL,

`BIZ_ADDRESS` varchar(128) DEFAULT NULL,

`TAX_REGISTRATION` varchar(32) DEFAULT NULL,

`INSTITUTION` varchar(16) DEFAULT NULL,

`LEGAL_NAME` varchar(40) DEFAULT NULL,

`LEGAL_CARD` varchar(32) DEFAULT NULL,

`LEGAL_PHONE` varchar(16) DEFAULT NULL,

`BIZ_SCOPE` varchar(128) DEFAULT NULL,

`BIZ_CONTENT` varchar(64) DEFAULT NULL,

`BIZ_TIME` varchar(32) DEFAULT NULL,

`LICENSE_EXPIRED` varchar(16) DEFAULT NULL,

`AVG_SINGLE_TRADE` int(11) DEFAULT NULL,

`AVG_MONTH_TRADE` int(11) DEFAULT NULL,

`BIZ_PLACE_OWNER` varchar(64) DEFAULT NULL,

`REGISTERED_CAPITAL` decimal(11,0) DEFAULT NULL,

`PAID_IN_CAPITAL` int(11) DEFAULT NULL,

`BIZ_PERIOD` tinyint(4) DEFAULT NULL,

`BIZ_AREA` int(11) DEFAULT NULL,

`SETTLE_PERIOD` tinyint(4) DEFAULT NULL,

`DELAY_TIME` varchar(50) DEFAULT NULL,

`DELAY_TYPE` tinyint(4) DEFAULT '0',

`BANK_CODE` varchar(40) DEFAULT NULL,

`BRANCH_CODE` varchar(25) DEFAULT NULL,

`BRANCH_CODE_ONE` varchar(25) DEFAULT NULL,

`BRANCH_CODE_TWO` varchar(25) DEFAULT NULL,

`BRANCH_NAME` varchar(128) DEFAULT NULL,

`ACCOUNT_CODE` varchar(32) DEFAULT NULL,

`ACCOUNT_NAME` varchar(80) DEFAULT NULL,

`BRANCH_PROVINCE` varchar(32) DEFAULT NULL,

`BRANCH_CITY_CODE` varchar(10) DEFAULT NULL,

`BRANCH_CITY_NAME` varchar(50) DEFAULT NULL,

`SETTLE_CURRENCY` varchar(16) DEFAULT NULL,

`SETTLE_PARAM` char(1) DEFAULT NULL,

`CUP_TYPE` tinyint(4) NOT NULL DEFAULT '1',

`CUP_CD` varchar(6) DEFAULT NULL,

`CUP_NM` varchar(80) DEFAULT NULL,

`UPI_TYPE` tinyint(4) NOT NULL DEFAULT '1',

`UPI_CD` varchar(6) DEFAULT NULL,

`UPI_NM` varchar(80) DEFAULT NULL,

`VISA_EDC_FEE` double DEFAULT NULL,

`VISA_DCC_FEE` double DEFAULT NULL,

`MASTERCARD_EDC_FEE` double DEFAULT NULL,

`MASTERCARD_DCC_FEE` double DEFAULT NULL,

`JCB_EDC_FEE` double DEFAULT NULL,

`AE_EDC_FEE` double DEFAULT NULL,

`DC_EDC_FEE` double DEFAULT NULL,

`CONTACT_NAME` varchar(40) DEFAULT NULL,

`CONTACT_FIXED` varchar(32) DEFAULT NULL,

`CONTACT_MOBILE` varchar(32) DEFAULT NULL,

`CONTACT_FAX` varchar(32) DEFAULT NULL,

`CONTACT_EMAIL` varchar(80) DEFAULT NULL,

`CONTACT_ADDRESS` varchar(128) DEFAULT NULL,

`CONTACT_ZIP` varchar(8) DEFAULT NULL,

`biz_license` text COMMENT '营业执照',

`tax_register_cert` text COMMENT '税务登记证',

`ins_cert` text COMMENT '组织机构代码证',

`legal_id_card` text COMMENT '法人身份证',

`open_license` text COMMENT '开户许可证',

`auth_letter` text COMMENT '授权书',

`portal_photo` text COMMENT '门头照片',

`cashier_photo` text COMMENT '收银台照片',

`scene_photo` text COMMENT '经营场景照片',

`mer_agreement` text COMMENT '商户协议',

`other_qualification` text COMMENT '其他特殊资质',

`EXPECT_OPEN_TIME` datetime DEFAULT NULL,

`IN_OUT_FLAG` varchar(32) DEFAULT NULL,

`DCC_MODE` int(2) DEFAULT '0',

`SPECIAL_FLAG` tinyint(4) DEFAULT NULL,

`TRADING_CURRENCY` varchar(3) DEFAULT NULL,

`STATUS` int(11) DEFAULT '0',

`EDITABLE` tinyint(4) DEFAULT NULL,

`MER_SINGLE_LIMIT` decimal(30,5) DEFAULT NULL,

`MER_DAY_LIMIT` decimal(30,5) DEFAULT NULL,

`MER_NATION` varchar(3) DEFAULT NULL,

`ROUTE_SCHEME` varchar(13) DEFAULT NULL,

`CREATOR_ID` int(11) DEFAULT NULL,

`CREATOR_NAME` varchar(32) DEFAULT NULL,

`create_time` datetime NOT NULL COMMENT '记录创建时间',

`modify_time` datetime NOT NULL COMMENT '最好修改时间',

`TERM_CNT` int(11) DEFAULT NULL,

`DATA_SRC` tinyint(4) NOT NULL DEFAULT '1',

`CUP_CARD_PLAN` bit(1) DEFAULT NULL,

`UPI_CARD_PLAN` bit(1) DEFAULT NULL,

`RISK_DESC` varchar(50) DEFAULT NULL,

`IS_FLAG` char(1) DEFAULT NULL,

`ALP` decimal(22,3) DEFAULT NULL,

`WXP` decimal(22,3) DEFAULT NULL,

`dfs_edc_fee` decimal(22,3) DEFAULT NULL,

`prp_edc_fee` decimal(22,3) DEFAULT NULL,

`in_account_id_card` text COMMENT '入账人身份证',

`in_account_bank_card` text COMMENT '入账银行卡信息',

`ins_credit_card` text COMMENT '机构信用代码证',

`ins_store_photo` text COMMENT '仓库照片',

`lease_agreement` text COMMENT '租赁协议',

`sct` decimal(22,3) DEFAULT NULL COMMENT '扫码支付(支付宝、微信整合)',

`card_type` char(1) DEFAULT '1' COMMENT '法人证件类型(1:身份证,2:护照)',

PRIMARY KEY (`STAGE_ID`),

KEY `mer_stage_s_e_ms` (`STATUS`,`EDITABLE`,`MER_STATUS`) USING BTREE

) ENGINE=InnoDB AUTO_INCREMENT=216826 DEFAULT CHARSET=utf8;

proc 表有 6450 条记录,DDL:

CREATE TABLE `proc` (

`proc_id` int(11) NOT NULL AUTO_INCREMENT COMMENT '流程id',

`proc_name` varchar(32) NOT NULL COMMENT '流程名称,如 新增商户全聚德审批流程',

`proc_type` tinyint(4) NOT NULL COMMENT '流程类型:1-新增商户,2-变更商户,3-新增终端',

`associated_id` int(11) NOT NULL COMMENT '流程关联的商户id或其他',

`node_id` tinyint(4) NOT NULL COMMENT '流程进行到哪个节点',

`associated_name` varchar(64) DEFAULT NULL COMMENT '流程关联的商户名称',

`proc_status` tinyint(4) NOT NULL DEFAULT '1' COMMENT '流程状态:1-启动流程,2-进行中,3-已完成',

`starter_id` int(11) NOT NULL COMMENT '流程发起者用户id',

`starter_name` varchar(32) NOT NULL COMMENT '流程发起者用户名',

`node_name` varchar(64) NOT NULL COMMENT '节点名称',

`next_id` tinyint(4) NOT NULL COMMENT '下一节点id',

`next_name` varchar(64) NOT NULL COMMENT '下一节点名称',

`create_time` datetime NOT NULL COMMENT '记录创建时间',

`ass_version` datetime NOT NULL COMMENT '关联版本号',

`node_remark` varchar(255) DEFAULT NULL COMMENT '备注',

`modify_time` datetime DEFAULT NULL COMMENT '上一节点完成时间',

`mer_id` int(11) NOT NULL,

PRIMARY KEY (`proc_id`),

KEY `proc_mer_id_index` (`mer_id`) USING BTREE

) ENGINE=InnoDB AUTO_INCREMENT=6451 DEFAULT CHARSET=utf8 COMMENT='流程';

关于这两张表的一个慢查询日志如下:

# Time: 150703 15:13:33

# User@Host: test[test] @ localhost [127.0.0.1] Id: 1

# Query_time: 2.101248 Lock_time: 0.046034 Rows_sent: 0 Rows_examined: 865689

SET timestamp=1435907613;

update mer_stage set editable = 1 where stage_id in(

select associated_id from proc where proc_id in(6446 , 6447 , 6450));

日志中可以看出该 sql 的执行时间是 2.101 s。

我们来查看一下该 sql 的执行计划:

注意:select_type 里出现了 DEPENDENT SUBQUERY。

这意味着什么?——子查询取决于外面的查询,MySql 先执行外查询,内查询根据这个查询结果(如执行计划里所述,190102 rows)的每一条记录组成新的查询语句:

select associated_id from proc where proc_id in(6446 , 6447 , 6450) and associated_id = '外查询结果.stage_id';

这就是个坑。我相信,每个写出上面这种 sql 的程序员都不会想到 MySql 会对其这样执行,这是大家不想看到的结果。

怎么办?

Uncorrelated subqueries treated as DEPENDENT by MySQL 提出了同样的问题但是却没有给出解决方案。

MySql 官方给出的解决方案是:

If you have a slow 'correlated' subquery with IN, you can optimize it with a join to get around the bug described by Ryan and Stephen. After the optimization the execution time is no longer O(M×N).

于是我们的 update 语句改写为:

update mer_stage m join proc p on m.stage_id = p.associated_id set m.editable = 1

where p.proc_id =6446 or p.proc_id =6447 or p.proc_id =6450;

它的执行计划是:

执行这个 update,用时 0.047s,意料之中。搞定。

有趣的是,我们来做一个尝试,把该 update 改为 select:

select * from mer_stage where stage_id in (select associated_id from proc where proc_id in (6446 , 6447 , 6450));

它的执行时间是 0.053 s,毫秒级。

该 sql 的执行计划是:

同样的写法,唯一不同的是一个 update 另一个 select,差别咋就那么大呢?看来优化器并不总是那么靠谱的,它在这里就对 update 那条 sql 的子查询优化的很糟糕。

参考资料

https://dev.mysql.com/doc/refman/5.5/en/correlated-subqueries.html