值得收藏:一份非常完整的MySQL规范
因为mysql优化器在选择如何优化查询时,会根据统一信息,对每一个可以用到的索引来进行评估,以生成出一个最好的执行计划,如果同时有很多个索引都可以用于查询,就会增加mysql优化器生成执行计划的时间,同样会降低查询性能。 2、禁止给表中的每一列都建立单独的索引 5.6版本之前,一个sql只能使用到一个表中的一个索引,5.6以后,虽然有了合并索引的优化方式,但是还是远远没有使用一个联合索引的查询方式好 3、每个Innodb表必须有个主键 Innodb是一种索引组织表:数据的存储的逻辑顺序和索引的顺序是相同的。 每个表都可以有多个索引,但是表的存储顺序只能有一种 Innodb是按照主键索引的顺序来组织表的。 不要使用更新频繁的列作为主键,不适用多列主键(相当于联合索引) 不要使用UUID、MD5、HASH、字符串列作为主键(无法保证数据的顺序增长)。 主键建议使用自增ID值。 五、常见索引列建议
并不要将符合1和2中的字段的列都建立一个索引,通常将1、2中的字段建立联合索引效果更好
六、如何选择索引列的顺序 建立索引的目的是:希望通过索引进行数据查找,减少随机IO,增加查询性能 ,索引能过滤出越少的数据,则从磁盘中读入的数据也就越少。
七、避免建立冗余索引和重复索引 因为这样会增加查询优化器生成执行计划的时间。
八、优先考虑覆盖索引 对于频繁的查询优先考虑使用覆盖索引。 覆盖索引:就是包含了所有查询字段(where,select,ordery by,group by包含的字段)的索引 覆盖索引的好处:
Innodb是以聚集索引的顺序来存储的,对于Innodb来说,二级索引在叶子节点中所保存的是行的主键信息, 如果是用二级索引查询数据的话,在查找到相应的键值后,还要通过主键进行二次查询才能获取我们真实所需要的数据。而在覆盖索引中,二级索引的键值中可以获取所有的数据,避免了对主键的二次查询 ,减少了IO操作,提升了查询效率。
由于覆盖索引是按键值的顺序存储的,对于IO密集型的范围查找来说,对比随机从磁盘读取每一行的数据IO要少的多,因此利用覆盖索引在访问时也可以把磁盘的随机读取的IO转变成索引查找的顺序IO。 九、索引SET规范 尽量避免使用外键约束
十、数据库SQL开发规范 1、建议使用预编译语句进行数据库操作 预编译语句可以重复使用这些计划,减少SQL编译所需要的时间,还可以解决动态SQL所带来的SQL注入的问题 只传参数,比传递SQL语句更高效 相同语句可以一次解析,多次使用,提高处理效率。 2、避免数据类型的隐式转换 隐式转换会导致索引失效。如:select name,phone from customer where id = '111'; 3、充分利用表上已经存在的索引
如a like '%123%',(如果无前置%,只有后置%,是可以用到列上的索引的)
如:有 a,b,c列的联合索引,在查询条件中有a列的范围查询,则在b,c列上的索引将不会被用到,在定义联合索引时,如果a列要用到范围查找的话,就要把a列放到联合索引的右侧。
因为not in 也通常会使用索引失效。 4、数据库设计时,应该要对以后扩展进行考虑 5、程序连接不同的数据库使用不同的账号,进制跨库查询
6、禁止使用SELECT * 必须使用SELECT <字段列表> 查询 原因:
7、禁止使用不含字段列表的INSERT语句 如:insert into values ('a','b','c'); 应使用insert into t(c1,c2,c3) values ('a','b','c'); 8、避免使用子查询,可以把子查询优化为join操作 通常子查询在in子句中,且子查询中为简单SQL(不包含union、group by、order by、limit从句)时,才可以把子查询转化为关联查询进行优化。 子查询性能差的原因:
9、避免使用JOIN关联太多的表 对于Mysql来说,是存在关联缓存的,缓存的大小可以由join_buffer_size参数进行设置。 在Mysql中,对于同一个SQL多关联(join)一个表,就会多分配一个关联缓存,如果在一个SQL中关联的表越多,所占用的内存也就越大。 如果程序中大量的使用了多表关联的操作,同时join_buffer_size设置的也不合理的情况下,就容易造成服务器内存溢出的情况,就会影响到服务器数据库性能的稳定性。 同时对于关联操作来说,会产生临时表操作,影响查询效率Mysql最多允许关联61个表,建议不超过5个。 10、减少同数据库的交互次数 数据库更适合处理批量操作 合并多个相同的操作到一起,可以提高处理效率 11、对应同一列进行or判断时,使用in代替or in的值不要超过500个in操作可以更有效的利用索引,or大多数情况下很少能利用到索引。 12、禁止使用order by rand() 进行随机排序 会把表中所有符合条件的数据装载到内存中,然后在内存中对所有数据根据随机生成的值进行排序,并且可能会对每一行都生成一个随机值,如果满足条件的数据集非常大,就会消耗大量的CPU和IO及内存资源。 推荐在程序中获取一个随机值,然后从数据库中获取数据的方式 13、WHERE从句中禁止对列进行函数转换和计算 对列进行函数转换或计算时会导致无法使用索引。 不推荐:
推荐:
14、在明显不会有重复值时使用UNION ALL而不是UNION
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |