提交mysql

This commit is contained in:
qiurunze123 2019-01-13 11:48:26 +08:00
parent 95b8debc5b
commit ee1f6e46bb
2 changed files with 123 additions and 0 deletions

View File

@ -87,6 +87,11 @@
#### [通信mq-Kafka--未更新](/docs/redis-code.md)
#### [微服务框架--未更新](/docs/redis-code.md)
#### [mysql数据库优化及架构学习](/docs/mysql.md)
#### [mysql数据库设计规范](/docs/mysql.md)
#### [mysql数据库设计实例](/docs/mysql.md)
#### [mysql数据库执行计划分析](/docs/mysql.md)
#### [mysql数据库备份和恢复](/docs/mysql.md)
#### [mysql数据库架构变迁](/docs/mysql.md)
#### [netty专题(已更新 by liuxiangyu)](/docs/netty.md)
#### [linux专题](/docs/linux.md)
#### [面试专题(最后更新)--未更新](/docs/code-solve.md)

View File

@ -100,6 +100,124 @@
6.尽量使用外键 不建议使用外检约束,但是一定要在表与表之间的关联键上建立索引
数据库字段设计规范
1.优先选择符合存储需要的最小的数据类型
1.将字符串转换成数字类型存储 INET_ATON('255.255.255.255') = 4294967295 字符串转ip
将字符串转换成数字类型存储 INET_NTOA('4294967295') = 255.255.255.255 ip 转字符串
2.对于非负数据采用无符号整形进行存储 signed int -2147483648 -- 2147483647
unsigned int -0 -- 4294967295
3.VARCHAR(N)中的N代表的是字符数而不是字节数 使用UTF-8存储汉字varchar(255) = 765个字节 存储255个汉字
4.过大的长度会消耗更多的内存 varchar是一个可变的长度
2.避免使用text,blob数据类型 建议blob或者时text分离到单独的表中
避免使用enum数据类型
3.尽可能的所有列都定义为NOT NULL
索引null列需要额外的空间来保存所以需要占用更多的空间
进行比较和计算的时候要对null值进行特别的处理
4.字符串存储日期型的数据不是正确的
无法用日期函数来进行计算和比较
用字符串存储日期要占用更多的空间
5.timestamp 和datatime 类型存储时间
timestamp 存储范围有限制 1970-01-01 00:00:01 2038-01-19 03:14:07
timestamp占用4字节和INT相同但是INT可读性能高
6.财务相关的金额类数据必须由decimal类型存储
decimal类型为精准的浮点数在计算时不会丢失精度
占用空间由定义的宽度来决定
可用于存储比bigint更大的整数类型
数据库sql开发规范
1.建议使用预编译语句对数据库进行操作
2.避免数据类型的隐式转换 不同表的相同列的数据类型不一致 会导致索引失效
3.重复利用已经存在的索引
1.避免使用双%%的查询条件 如 a like '%1323%'
2.一个sql只能利用到复合索引中的一列进行范围查询
有 a,b,c列的联合索引在查询条件中有a列的范围查询则在b,c列上的索引将不会被用到
在定义联合索引时如果a列要用到范围查找的话就要把a列放到联合索引的右侧
3.使用left join 或者not exists 来优化not in偶尔也会导致索引失效 操作
4.程序链接不同数据库要使用不同的账号,禁止跨库连接为迁移和分库分表做预备
5.禁止select * 必须使用select <字段列表> * 无法覆盖索引 减少表结构变更 对程序带来的影响)
6.insert 明确字段列表
7.禁止使用子查询可以把子查询优化为join操作
子查询结果集无法使用索引
子查询会产生临时表操作,如果子查询数据量大则会更严重
8.避免使用过多的join 关联表
于Mysql来说是存在关联缓存的缓存的大小可以由join_buffer_size参数进行设置
在Mysql中对于同一个SQL多关联join一个表就会多分配一个关联缓存如果在一个SQL中关联的表越多
所占用的内存也就越大
如果程序中大量的使用了多表关联的操作同时join_buffer_size设置的也不合理的情况下就容易造成服务器内存溢出的情况
就会影响到服务器数据库性能的稳定性
同时对于关联操作来说,会产生临时表操作,影响查询效率
Mysql最多允许关联61个表建议不超过5个
9.减少同数据库的交互次数 多个相同的操作合并在一起
10.对应同一列进行or判断时使用in代替or
in 的值不要超过500个
in 操作可以更有效的利用索引or大多数情况下很少能利用到索引
11.禁止order by rand() 进行随机排序
会把表中所有符合条件的数据装载到内存中,然后在内存中对所有数据根据随机生成的值进行排序
并且可能会对每一行都生成一个随机值如果满足条件的数据集非常大就会消耗大量的CPU和IO及内存资源
推荐在程序中获取一个随机值,然后从数据库中获取数据的方式
12.where 从句禁止对列进行函数转换和计算(导致无法使用相关列的索引)
SELECT错误写法
*
FROM
miaosha_message
WHERE
create_time >= '20190101'
AND create_time < '20190102'
SELECT (正确写法)
*
FROM
miaosha_message
WHERE
date
(create_time) = '20190101'
13.不会有重复值时使用UNION ALL 而不是UNION
UNION 会把两个结果集的所有数据放到临时表中后再进行去重操作
UNION ALL 不会再对结果集进行去重操作
14.拆分大sql变为小sql
大SQL:逻辑上比较复杂需要占用大量CPU进行计算的SQL
MySQL 一个SQL只能使用一个CPU进行计算
SQL拆分后可以通过并行执行来提高处理效率
数据库操作行为规范
过大数据的100万批量写操作要分批多次操作
1.大批量操作可能会导致严重的主从延迟
2. binlog日志为row格式时会产生大量的日志
大批量写操作会产生大量日志特别是对于row格式二进制数据而言由于在row格式中会记录每一行数据的修改我们一次修改的数据越多
产生的日志量也就会越多,日志的传输和恢复所需要的时间也就越长,这也是造成主从延迟的一个原因
3. 避免产生大事务操作
大批量修改数据一定是在一个事务中进行的这就会造成表中大批量数据进行锁定从而导致大量的阻塞阻塞会对MySQL的性能产生非常大的影响
特别是长时间的阻塞会占满所有数据库的可用连接,这会使生产环境中的其他应用无法连接到数据库,因此一定要注意大批量写操作要进行分批
4.对于大表的修改使用pt-online-schema-change
1.原理: 会在原表的结构上建造一个新表 复制数据
2.避免延迟,修改时锁表
5.禁止super权限滥用
6.数据账号连接最小