你认为到底负载高好,还是低好呢?在实际的生产中,一般认为 cpu只要不超过90%都没什么问题 。
当然不排除下面这些特殊情况:
问题一:cpu负载高,IO负载低
- 内存不够
- 磁盘性能差
- SQL问题 →去数据库层,进一步排查sql问题
- IO出问题了(磁盘到临界了、raid设计不好、raid降级、锁、在单位时间内tps过高)
- tps过高: 大量的小数据IO、大量的全表扫描
问题二:IO负载高,cpu负载低
- 大量小的IO 写操作:
- autocommit ,产生大量小IO
- IO/PS,磁盘的一个定值,硬件出厂的时候,厂家定义的一个每秒最大的IO次数。
- 大量大的IO 写操作
- SQL问题的几率比较大
问题三:IO和cpu负载都很高
5 基础优化
5.1 优化思路
定位问题点吮吸
硬件 → 系统 → 应用 → 数据库 → 架构(高可用、读写分离、分库分表)
处理方向
明确优化目标、性能和安全的折中、防患未然
5.2 硬件优化
主机方面:
- 根据数据库类型,主机CPU选择、内存容量选择、磁盘选择
- 平衡内存和磁盘资源
- 随机的I/O和顺序的I/O
- 主机 RAID卡的BBU(Battery Backup Unit)关闭
- cpu的选择:
根据不同的业务类型进行选择:
- cpu密集型:计算比较多,OLTP 主频很高的cpu、核数还要多
- IO密集型:查询比较,OLAP 核数要多,主频不一定高的
内存的选择:
- OLAP类型数据库,需要更多内存,和数据获取量级有关。
- OLTP类型数据一般内存是cpu核心数量的2倍到4倍,没有最佳实践。
存储方面:
- 根据存储数据种类的不同,选择不同的存储设备
- 配置合理的RAID级别(raid5、raid10、热备盘)
- 对与操作系统来讲,不需要太特殊的选择,最好做好冗余(raid1)(ssd、sas 、sata)
- raid卡:主机raid卡选择:
- 实现操作系统磁盘的冗余(raid1)
- 平衡内存和磁盘资源
- 随机的I/O和顺序的I/O
- 主机 RAID卡的BBU(Battery Backup Unit)要关闭。
网络设备方面:
使用流量支持更高的网络设备(交换机、路由器、网线、网卡、HBA卡)
注意:以上这些规划应该在初始设计系统时就应该考虑好。
5.3 服务器硬件优化
1、物理状态灯:
2、自带管理设备:远程控制卡(FENCE设备:ipmi ilo idarc),开关机、硬件监控。
3、第三方的监控软件、设备(snmp、agent)对物理设施进行监控
4、存储设备:自带的监控平台。EMC2(hp收购了), 日立(hds),IBM低端OEM hds,高端存储是自己技术,华为存储
5.4 系统优化
CPU:
基本不需要调整,在硬件选择方面下功夫即可。
SWAP:
MySQL尽量避免使用swap。
阿里云的服务器中默认swap为0
IO :
raid、no lvm、 ext4或xfs、ssd、IO调度策略
Swap调整(不使用swap分区)
- /proc/sys/vm/swappiness的内容改成0(临时),/etc/sysctl.conf上添加vm.swappiness=0(永久)
这个参数决定了Linux是倾向于使用swap,还是倾向于释放文件系统cache。在内存紧张的情况下,数值越低越倾向于释放文件系统cache。当然,这个参数只能减少使用swap的概率,并不能避免Linux使用swap。修改MySQL的配置参数innodb_flush_method,开启O_DIRECT模式。这种情况下,InnoDB的buffer pool会直接绕过文件系统cache来访问磁盘,但是redo log依旧会使用文件系统cache。
值得注意的是,Redo log是覆写模式的,即使使用了文件系统的cache,也不会占用太多
IO调度策略
- #echo deadline>/sys/block/sda/queue/scheduler 临时修改为deadline
永久修改
vi /boot/grub/grub.conf
更改到如下内容:
kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet
5.5 系统参数调整
(编辑:晋中站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!
|