提交mysql

2023-11-19 22:41:03 +08:00 · 2019-01-13 11:48:26 +08:00 · 2019-01-13 11:48:26 +08:00 · ee1f6e46bb
commit ee1f6e46bb
parent 95b8debc5b
2 changed files with 123 additions and 0 deletions
--- a/README.md
+++ b/README.md
@ -87,6 +87,11 @@
 #### [通信mq-Kafka--未更新](/docs/redis-code.md)
 #### [微服务框架--未更新](/docs/redis-code.md)
 #### [mysql数据库优化及架构学习](/docs/mysql.md)
+####     [mysql数据库设计规范](/docs/mysql.md)
+####     [mysql数据库设计实例](/docs/mysql.md)
+####     [mysql数据库执行计划分析](/docs/mysql.md)
+####     [mysql数据库备份和恢复](/docs/mysql.md)
+####     [mysql数据库架构变迁](/docs/mysql.md)
 #### [netty专题(已更新 by liuxiangyu)](/docs/netty.md)
 #### [linux专题](/docs/linux.md)
 #### [面试专题（最后更新）--未更新](/docs/code-solve.md)
--- a/docs/mysql.md
+++ b/docs/mysql.md
@ -100,6 +100,124 @@
       6.尽量使用外键 不建议使用外检约束，但是一定要在表与表之间的关联键上建立索引
     
     
+     数据库字段设计规范
+     
+     1.优先选择符合存储需要的最小的数据类型
+       1.将字符串转换成数字类型存储  INET_ATON('255.255.255.255') = 4294967295 字符串转ip
+       将字符串转换成数字类型存储  INET_NTOA('4294967295') = 255.255.255.255 ip 转字符串
+       2.对于非负数据采用无符号整形进行存储  signed int -2147483648 -- 2147483647
+          unsigned int -0 -- 4294967295    
+       3.VARCHAR(N)中的N代表的是字符数而不是字节数 使用UTF-8存储汉字varchar(255) = 765个字节 存储255个汉字
+       4.过大的长度会消耗更多的内存 varchar是一个可变的长度 
+     2.避免使用text,blob数据类型 建议blob或者时text分离到单独的表中
+       避免使用enum数据类型
+     3.尽可能的所有列都定义为NOT NULL
+       索引null列需要额外的空间来保存，所以需要占用更多的空间
+       进行比较和计算的时候要对null值进行特别的处理
+     4.字符串存储日期型的数据不是正确的 
+        无法用日期函数来进行计算和比较
+        用字符串存储日期要占用更多的空间
+     5.timestamp 和datatime 类型存储时间
+       timestamp 存储范围有限制 1970-01-01 00:00:01 ～2038-01-19 03:14:07 
+       timestamp占用4字节和INT相同，但是INT可读性能高
+     6.财务相关的金额类数据，必须由decimal类型存储
+       decimal类型为精准的浮点数，在计算时不会丢失精度
+       占用空间由定义的宽度来决定
+       可用于存储比bigint更大的整数类型
+       
+    数据库sql开发规范
+    
+     1.建议使用预编译语句对数据库进行操作
+     
+     2.避免数据类型的隐式转换 不同表的相同列的数据类型不一致 会导致索引失效
+     
+     3.重复利用已经存在的索引
+        1.避免使用双%%的查询条件 如 a like '%1323%'
+        2.一个sql只能利用到复合索引中的一列进行范围查询
+        有 a,b,c列的联合索引，在查询条件中有a列的范围查询，则在b,c列上的索引将不会被用到，
+        在定义联合索引时，如果a列要用到范围查找的话，就要把a列放到联合索引的右侧
+        3.使用left join 或者not exists 来优化not in（偶尔也会导致索引失效） 操作 
+        
+     4.程序链接不同数据库要使用不同的账号，禁止跨库连接为迁移和分库分表做预备
+     
+     5.禁止select * 必须使用select <字段列表> （* 无法覆盖索引  减少表结构变更 对程序带来的影响）
+     
+     6.insert 明确字段列表
+     
+     7.禁止使用子查询，可以把子查询优化为join操作
+        子查询结果集无法使用索引
+        子查询会产生临时表操作，如果子查询数据量大则会更严重
+        
+     8.避免使用过多的join 关联表
+       于Mysql来说，是存在关联缓存的，缓存的大小可以由join_buffer_size参数进行设置
+       在Mysql中，对于同一个SQL多关联（join）一个表，就会多分配一个关联缓存，如果在一个SQL中关联的表越多，
+       所占用的内存也就越大
+       如果程序中大量的使用了多表关联的操作，同时join_buffer_size设置的也不合理的情况下，就容易造成服务器内存溢出的情况，
+       就会影响到服务器数据库性能的稳定性
+       同时对于关联操作来说，会产生临时表操作，影响查询效率
+       Mysql最多允许关联61个表，建议不超过5个    
+            
+      9.减少同数据库的交互次数 多个相同的操作合并在一起
+      
+      10.对应同一列进行or判断时，使用in代替or
+         
+        in 的值不要超过500个
+        in 操作可以更有效的利用索引，or大多数情况下很少能利用到索引
+      
+      11.禁止order by rand() 进行随机排序
+      
+      会把表中所有符合条件的数据装载到内存中，然后在内存中对所有数据根据随机生成的值进行排序
+      并且可能会对每一行都生成一个随机值，如果满足条件的数据集非常大，就会消耗大量的CPU和IO及内存资源
+      推荐在程序中获取一个随机值，然后从数据库中获取数据的方式       
+      
+      12.where 从句禁止对列进行函数转换和计算(导致无法使用相关列的索引)
+      
+      SELECT（错误写法）
+      	* 
+      FROM
+      	miaosha_message 
+      WHERE
+      	create_time >= '20190101' 
+      	AND create_time < '20190102'
+      	
+      SELECT （正确写法）
+        	* 
+        FROM
+        	miaosha_message 
+        WHERE
+        	date
+        	(create_time) = '20190101' 
+        	
+       13.不会有重复值时使用UNION ALL 而不是UNION
+          UNION 会把两个结果集的所有数据放到临时表中后再进行去重操作
+          UNION ALL 不会再对结果集进行去重操作
+          
+       14.拆分大sql变为小sql
+       大SQL:逻辑上比较复杂，需要占用大量CPU进行计算的SQL
+       MySQL 一个SQL只能使用一个CPU进行计算
+       SQL拆分后可以通过并行执行来提高处理效率
+       
+     
+      数据库操作行为规范
+      
+      过大数据的（100万）批量写操作要分批多次操作
+       1.大批量操作可能会导致严重的主从延迟
+       2. binlog日志为row格式时会产生大量的日志
+       大批量写操作会产生大量日志，特别是对于row格式二进制数据而言，由于在row格式中会记录每一行数据的修改，我们一次修改的数据越多，
+       产生的日志量也就会越多，日志的传输和恢复所需要的时间也就越长，这也是造成主从延迟的一个原因
+       3. 避免产生大事务操作
+       大批量修改数据，一定是在一个事务中进行的，这就会造成表中大批量数据进行锁定，从而导致大量的阻塞，阻塞会对MySQL的性能产生非常大的影响
+       特别是长时间的阻塞会占满所有数据库的可用连接，这会使生产环境中的其他应用无法连接到数据库，因此一定要注意大批量写操作要进行分批
+       4.对于大表的修改使用pt-online-schema-change
+        1.原理： 会在原表的结构上建造一个新表 复制数据 
+        2.避免延迟，修改时锁表
+       5.禁止super权限滥用
+       6.数据账号连接最小
+     
+       
+       
+
+