miaosha/mysql-2.md at f3e998261d2f8d96a0f9350aea6313b151f8ea62

mirror of https://github.com/qiurunze123/miaosha.git synced 2023-11-19 22:41:03 +08:00

2022-09-21 17:59:40 +08:00

13 KiB

Raw Blame History

mysql数据库设计与优化与架构模拟场景（京东商城）

任何优化多需要场景，本次所有的场景为京东商城的数据库设计模拟！
有问题或者宝贵意见联系我的QQ,非常希望你的加入！

##简介：

 设计：
 1.常见业务处理
 2.执行计划分析
 3.如何优化分页查询示例
 4.如何删除重复数据示例
 5.如何进行分区间数据统计显示
 6.捕获有问题的sql慢查日志

执行计划能够告诉我们什么

    1.sql如何使用索引
    2.链接查询的执行顺序
    3.查询扫描数据行数

执行计划内容

 ID列：数据为一组数字表示执行select语句的顺序 
      id值相同的时候执行顺序由上至下
      id值越大优先级越高，越先被执行
      ID列中的如果数据为一组数字，表示执行SELECT语句的顺序；如果为NULL，则说明这一行数据是由另外两个SQL语句进行 UNION操作后产生的结果集
      
 SELECT_TYPE |_ SIMPLE不包含子查询或者是UNION操作的查询
             |_ PRIMARY 查询中如果包含任何子查询，那么最外层的查询则被标记为 PRIMARY
             |_ SUBQUERY select 列表中的子查询
             |_ DEPENDENT 依赖外部结果的子查询
             |_ SUBQUERY 依赖外部结果的子查询 
             |_ UNION Union操作的第二个或是之后的查询的值为union
             |_ DEPENDENT UNION 当UNION作为子查询时，第二或是第二个后的查询的select_type值
             |_ UNION RESULT UNION产生的结果集
             |_ DERIVED  出现在FROM子句中的子查询
 
 TABLE  |_ 所在表的名称，如果表取了别名，则显示的是别名
        |_ <union M,N>： 由ID为M,N查询union产生的结果集
        |_ <derived N>/<subquery N> ：由ID为N的查询产生的结果
        
 PARTITIONS 分区表 
 查询匹配的记录来自哪一个分区
 对于分区表，显示查询的分区ID
 对于非分区表，显示为NULL
 
 TYPE列
      |_ system 	这是const联接类型的一个特例，当查询的表只有一行时使用 
      |_ const 	表中有且只有一个匹配的行时使用，如对主键或是唯一索引的查询，这是效率最高的联接方式
      |_ eq_ref 	唯一索引或主键索引查询，对应每个索引键，表中只有一条记录与之匹配
      |_ ref 	非唯一索引查找，返回匹配某个单独值的所有行
      |_ ref_or_null 	类似于ref类型的查询，但是附加了对NULL值列的查询
      |_ index_merge 	该联接类型表示使用了索引合并优化方法
      |_ range 	索引范围扫描，常见于between、>、<这样的查询条件
      |_ index 	FULL index Scan 全索引扫描，同ALL的区别是，遍历的是索引树
      |_ ALL 	FULL TABLE Scan 全表扫描，这是效率最差的联接方式
      
  Extra列
      |_ Distinct 	优化distinct操作，在找到第一个匹配的元素后即停止查找
      |_ Not exists 	使用not exists来优化查询
      |_ Using filesort 	使用额外操作进行排序，通常会出现在order by或group by查询中
      |_ Using index 	使用了覆盖索引进行查询
      |_ Using temporary 	MySQL需要使用临时表来处理查询，常见于排序，子查询，和分组查询
      |_ Using where 	需要在MySQL服务器层使用WHERE条件来过滤数据
      |_ select tables optimized away 	直接通过索引来获得数据，不用访问表，这种情况通常效率是最高的
        
  POSSIBLE_KEYS列
       |_    指出MySQL能使用哪些索引来优化查询
       |_    查询列所涉及到的列上的索引都会被列出，但不一定会被使用

  KEY列
       |_查询优化器优化查询实际所使用的索引
       |_如果表中没有可用的索引，则显示为NULL
       |_如果查询使用了覆盖索引，则该索引仅出现在Key列中

  KEY_LEN列
       |_ 显示MySQL索引所使用的字节数，在联合索引中如果有3列，假如3列字段总长度为100个字节
          Key_len显示的可能会小于100字节，比如30字节
          这就说明在查询过程中没有使用到联合索引的所有列，只是利用到了前面的一列或2列
       |_ 表示索引字段的最大可能长度 
       |_ Key_len的长度由字段定义计算而来，并非数据的实际长度
       
  Ref列
       |_ 表示当前表在利用Key列记录中的索引进行查询时所用到的列或常量
       |_
       |_
       
  rows列
  
       |_ 表示MySQL通过索引的统计信息，估算出来的所需读取的行数（关联查询时，显示的是每次嵌套查询时所需要的行数
       |_ Rows值的大小是个统计抽样结果，并不十分准确
  
  Filtered列 
       |_ 表示返回结果的行数占需读取行数的百分比
       |_ Filtered列的值越大越好（值越大，表明实际读取的行数与所需要返回的行数越接近）
       |_ Filtered列的值依赖统计信息，所以同样也不是十分准确，只是一个参考值
       
  执行计划的限制
      |_ 无法展示存储过程，触发器，UDF对查询的影响
      |_ 无法使用EXPLAIN对存储过程进行分析
      |_ 早期版本的MySQL只支持对SELECT语句进行分析
   
  ----------------------------------------------------
  如何删除重复数据 
  删除评论表中的对同一个商品的重复评论，只保留最早的一条
  
  |--- 查看是否存在对于同一订单同一商品的重复评论，如果存在，进行后续步骤
       查询语句：
       SELECT order_id,product_id,COUNT(*) FROM product_comment
       GROUP BY order_id,product_id HAVING COUNT(*) > 1;
  
  |--- 备份product_comment表（避免误删除的情况）
       CREATE  TABLE bak_product_comment_190108 AS  SELECT * FROM product_comment;
       错误代码：1786 Statement violates GTID consistency:CREATE TABLE ... SELECT.
       则换用下面的语句
           CREATE  TABLE bak_product_comment_190108 AS  LIKE  product_comment;
           INSERT INTO bak_product_comment_190108  SELECT * FROM product_comment；
       错误代码：1786
       Statement violates GTID consistency:CREATE TABLE ... SELECT.
       错误原因
       这是因为在5.6及以上的版本内，开启了 enforce_gtid_consistency=true 功能导致的，MySQL官方解释说当启用 enforce_gtid_consistency 功能的时候，MySQL只允许能够保障事务安全，并且能够被日志记录的SQL语句被执行，像create table … select 和 create temporarytable语句，以及同时更新事务表和非事务表的SQL语句或事务都不允许执行。
       解决办法
       
     |---- 修改 ：
           SET @@GLOBAL.ENFORCE_GTID_CONSISTENCY = off;
           配置文件中 ：
           ENFORCE_GTID_CONSISTENCY = off;
     |---- 
           create table xxx as select 的方式会拆分成两部分。
           create table xxxx like data_mgr;
           insert into xxxx select *from data_mgr;
           如果表数据量比较大，则使用mysql dump的方式导出成文件进行备份
       
    
     |---- 删除同一订单的重复评论
           删除语句：
           DELETE a FROM product_comment a 
           JOIN(
           SELECT order_id,product_id,MIN(comment_id) AS comment_id 
           FROM product_comment
           GROUP BY order_id,product_id 
           HAVING COUNT(*) > 1
           ) b on a.order_id = b.order_id AND a.product_id = b.product_id
           AND a.comment_id > b.comment_id;
           
           
   分区间统计 
   
   统计消费总金额大于1000元的，800到1000元的，500到800元的，以及500元以下的人数


    SELECT 
    COUNT(CASE WHEN IFNULL(total_money,0) >= 1000 THEN a.customer_id END) AS '大于1000'
    ,COUNT(CASE WHEN IFNULL(total_money,0) >= 800 AND IFNULL(total_money,0)<1000 
        THEN a.customer_id END) AS '800~1000'
    ,COUNT(CASE WHEN IFNULL(total_money,0) >= 500 AND IFNULL(total_money,0)<800 
        THEN a.customer_id END) AS '500~800'
    ,COUNT(CASE WHEN IFNULL(total_money,0) < 500 THEN a.customer_id END)  '小于500'
    FROM mc_userdb.customer_login a 
    LEFT JOIN 
    ( 
    SELECT customer_id,SUM(order_money) AS total_money
        FROM mc_orderdb.order_master 
        GROUP BY customer_id
        ) b
    ON a.customer_id = b.customer_id

for example测试表分析执行计划 (联合索引和单列索引)

 CREATE TABLE `miaosha_mysql_test` (
   `id` bigint(20) NOT NULL AUTO_INCREMENT,
   `userId` varchar(255) CHARACTER SET utf8 COLLATE utf8_bin NOT NULL DEFAULT '' COMMENT '用户id',
   `mobile` varchar(24) NOT NULL DEFAULT '' COMMENT '手机号码',
   `month` varchar(32) DEFAULT NULL COMMENT '月份',
   `createTime` datetime DEFAULT NULL COMMENT '创建时间',
   `overTime` datetime DEFAULT NULL COMMENT '修改时间',
   PRIMARY KEY (`id`),
   KEY `联合索引` (`userId`,`mobile`,`month`)
 ) ENGINE=InnoDB AUTO_INCREMENT=71185 DEFAULT CHARSET=utf8 COMMENT='测试'

建立联合索引的列userId,mobile,month 三个建立联合索引

  EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE userid='2222' and mobile='166011'

  无索引可用
  
  EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE  mobile='166011' ;

  有索引可用
  
  EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE  userid='2222' or mobile='166011' ;

  有索引可用

  有索引可用 当然这才是正确的用法！！！

创建三个单列的索引

  CREATE INDEX useridsingle  ON miaosha_mysql_test(userid);
  CREATE INDEX mobilesingle  ON miaosha_mysql_test(mobile);
  CREATE INDEX monthsingle  ON miaosha_mysql_test(month);
 
 EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE userid='2222' and mobile='166011' and month=1;

 只是用了useridsingle 有索引可用 
 
 EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE mobile='13281899972' AND month='2018-04'

 EXPLAIN SELECT * FROM `miaosha_mysql_test` WHERE  userid='2222' OR mobile='13281899972'

  有索引可用 都用上了

多个单列索引在多条件查询时只会生效第一个索引！所以多条件联合查询时最好建联合索引！

最左前缀原则：

|_在创建联合索引时，要根据业务需求，where子句中使用最频繁的一列放在最左边。这样的话扩展性较好
|_比如 userid 经常需要作为查询条件，而 mobile 不常常用
|_则需要把 userid 放在联合索引的第一位置，即最左边
|_第一个字段是范围查询需要单独建一个索引

同时存在联合索引和单列索引（字段有重复的），这个时候查询mysql会怎么用索引呢

当一个表有多条索引可走，那么会根据优化器的查询成本来选择走哪个索引

 联合索引本质：
 当创建(a,b,c)联合索引时，相当于创建了(a)单列索引，(a,b)联合索引以及(a,b,c)联合索引 
 想要索引生效的话,只能使用 a和a,b和a,b,c三种组合，当然a,c也可以但是只用到了a
 
 1.需要加索引的字段，要在where条件中 
 2、数据量少的字段不需要加索引；因为建索引有一定开销，如果数据量小则没必要建索引（速度反而慢） 
 3、如果where条件中是OR关系，加索引不起作用 
 4、联合索引比对每个列分别建索引更有优势，因为索引建立得越多就越占磁盘空间，
 在更新数据的时候速度会更慢。另外建立多列索引时，顺序也是需要注意的，
 应该将严格的索引放在前面，这样筛选的力度会更大，效率更高。

13 KiB Raw Blame History Unescape Escape

mysql数据库设计与优化与架构 模拟场景（京东商城）

13 KiB

Raw Blame History

mysql数据库设计与优化与架构模拟场景（京东商城）