【mysql】mysql 数据备份与恢复使用详解
对一个运行中的线上系统来说,定期对数据库进行备份是非常重要的,备份不仅可以确保数据的局部完整性,一定程度上也为数据安全性提供了保障,设想如果某种极端的场景下,比如磁盘
一、前言 对一个运行中的线上系统来说,定期对数据库进行备份是非常重要的,备份不仅可以确保数据的局部完整性,一定程度上也为数据安全性提供了保障,设想如果某种极端的场景下,比如磁盘损坏导致某个时间段数据丢失,或者误操作导致数据表数据被删等... 这种情况在现实中可以说无处不在,为了避免数据丢失或损坏带来的巨大损失,有必要对线上系统的数据定期做备份,而备份的直接好处就是,一旦数据需要做恢复的时候就可以利用这些备份数据快速恢复,从而最大程度减少损失。 二、数据备份策略 根据实际的业务需求,经验参考可以据数据规模大小,服务器磁盘容量,大致可分为下面几种: 1、全备 备份完整的数据库,全量数据就是数据库中所有的数据(或某一个库的全部数据); 2、增备 ?增量数据就是指上一次全量备份数据之后到下一次全备之前数据库所更新的数据,对于mysqldump,binlog就是增量数据; 3、差异备份 三、数据备份类型 根据数据备份时对生产系统的影响,可以做如下分类: 1、冷备 停库,停服务,备份 这些备份操作在用户不能访问数据的时候进行,因此无法读取或修改数据。这些脱机备份会阻止执行任何使用数据的行为。这些类型的备份不会干扰正常运行的系统的性能。但是,对于某些应用程序,会无法接受必须在一段较长的时间里锁定或完全阻止用户访问数据。 2、热备 不停库,不停服务,备份,也不会(锁表)阻止用户的写入 这些动态备份在读取或修改数据的过程中进行,很少中断或者不中断传输或处理数据的功能。使用热备份时,系统仍可供读取和修改数据的操作访问。 3、温备 不停库,不停服务,备份,会(锁表) 阻止用户的写入 这些备份在读取数据时进行,但在多数情况下,在进行备份时不能修改数据本身。这种中途备份类型的优点是不必完全锁定最终用户。但其不足之处在于无法在进行备份时修改数据集,这可能使这种类型的备份不适用于某些应用程序。在备份过程中无法修改数据可能产生性能问题。 四、前置准备 提前搭建好mysql服务(本文以mysql5.7为例进行说明),并创建一个测试使用的数据库,若干数据表; 五、mysqldump 数据备份命令使用 mysqldump是mysql自带的数据备份命令,使用该命令可以完成数据库,数据表等多种备份策略,下面针对该命令的使用做详细的说明; 1、命令格式
关于选项部分,包含的参数是比较多的,下面列举常用的一些参数选项
2、案例演示 1)备份全库
2)备份数据库【一个或多个】 使用 -- databases 或 - B 参数,该参数后面跟数据库名,多个库间中间用空格MySQL 导入数据,如果指定 databases 参数,备份文件中会存在创建数据库的语句,如果不指定参数,则不存在; mysqldump –u user –h host –p -- databases [ 数据库的名称 1 [ 数据库的名称 2...]] > 备份文件名称 .sql
3)备份数据表 如果业务中不需要对全库做备份,只想备份部分表的时候, mysqldump –u user –h host –p密码 数据库名 [ 表名 1 [ 表名 2...]] > 备份文件名称 .sql 备份shake_date 下面的t_user表 4)只备份表结构
备份shake_date下面的t_user表,只备份表结构
可以打开备份的文件检查下,可以发现这里就只剩下表结构; 5)只备份表的部分数据 有时候一张表数据量很大,只需要部分数据,这时就可以使用 --where 选项了,where后面附 带需要满足的条件; 如下,备份t_user表中age大于12岁的用户
6)排除某些表的备份 如果备份某个库,但某些表数据量很大或与业务关联不大,这时候可以考虑排除这些表的备份,适用选项 --ignore-table ; 如下备份shake库下的表,排除t_no这个表
3、其他重要参数选项补充 在实际生产中,备份数据需要考虑的因素其实更多,考虑的越细致,在后续在数据恢复的时候就越精确,下面列举一些实际生产备份中可能用得上的额外的参数选项;
更多的参数,可以通过命令: mysqldump --help 进行查看和学习,每一项都有详细的介绍,可以结合官网一起学习; 在以上罗列的参数中,有下面三个参数选项这里做一下补充说明,也是备份过程中常常会涉及到的 1)--master-data 可选值 : 1 ,2 通过mysqldump --help 命令可以清楚查看官方对该命令的解释,这里简单说下这个参数的作用 以--master-data=2为例进行说明 以注释的形式,保存备份开始时间点的binlog的状态信息 2)--single-transaction innodb 存储引擎开启热备(快照备份)功能 直观上理解,使用该参数,可以在数据备份期间开启类似于事务的操作,这样的话可以避免外部的DDL操作带来备份时的数据上的影响,比如有如下场景,在mysql5.6版本中可能出现的情况: 如果配合上面的master-data可以自动实现加锁 3)--set-gtid-purged 此为默认参数,即使在命令中不写,依旧生效,它的效果是在mysqldump输出的备份文件中生成 SET@@GLOBAL.GTID_PURGED语句;备份文件中的这条语句记录了GTID号, 可选值:auto , on 使用场景 4)--max-allowed-packet=# 适当调大该参数,可以避免在备份数据量过大时因数据落盘时数据包过大的备份失败问题 5)-R -E --triggers 备份数据时连同触发器函数等也一同进行备份 操作演示 --set-gtid-purged=OFF
--set-gtid-purged=on 设置该参数之后,最明显的效果就是打开备份脚本文件,可以看到下面的信息,开启这个参数后在构建主从复制的时候会用上 --max-allowed-packet=# 在一些数据量比较大的备份情况下,建议适当的调大该参数
六、mysqldump 数据恢复 使用mysqldump可以对备份的数据进行恢复,基本语法 mysql –u root –p [dbname] < backup .sql 1、全量恢复 如果备份文件中包含了创建数据库的语句,则恢复的时候不需要指定数据库名称 删除shake_date数据库 执行数据恢复,再次查看发现数据就回来了;
2、全量备份中恢复单库 有整个实例的备份,但只想恢复某个数据库,这时可以从全量备份中分理出单个库的备份,可以参考下面的命令,比如将shake_date数据库从full.sql中分离出来;
3、从某个数据库中恢复单表数据 这也是一种比较常见的需求了,比如业务中某些表的数据非常重要,优先恢复这些表,就可以用到这个功能,操作步骤如下: cat shake_full.sql | sed -e '/./{H;$!d;}' -e 'x;/CREATE TABLE `t_user`/!d;q' > t_user_structure.sql cat shake_full.sql | grep --ignore-case 'insert into `t_user`' > t_user_data.sql 首先,将shake_date库中的t_user表删除 依次执行上面的sql,即建表sql以及insert的数据sql从全库的sql备份中分离出来 可以打开一个看看 然后再执行数据的恢复
4、使用dump + binlog进行数据恢复 下面说一个具体的场景,在生产环境下,假如定期对某个数据库进行全备,比如每周2的晚上进行全备,但现在发生了一件事,即在周三的时候,某位同事不小心将某张表的数据删除了,这该怎么办呢? 可以这么考虑,从周二全备那天来看,备份的数据是截止到那个时间点的全量数据,备份的时候可以将 master-data参数加进去,这样备份出来的数据中就有了那一刻binlog中的数据位置点,而在binlog日志中,记录了完整的操作记录行,那么就可以结合起来对数据进行快速恢复; 操作步骤如下: 1)创建一个数据库和数据表 给t1表随机插入几条数据 2)模拟周2对当前数据库进行全备
注意: --master-data=2 这个参数一定要开启,这个参数会记录备份那一刻的位置 3)模拟周3又对t1表做了相关的数据操作 4)模拟周3不小心将数据库删了 5)执行数据恢复 恢复步骤 将备份的sql中的下面的信息定位到,CHANGE 开头的表示在binlog中记录的位置号为4001,这就是说,剩下的待恢复的数据从4001开始截取就可以了;
定位到mysql的binlog位置,结合上述的gtid,通过binlog进行恢复,使用下面的命令检查最后删除的位置点;
在上面我们定位到备份中的sql文件中的gtid是1~16,这里最后drop的时候是20这个位置,则需要截取的那部分就是17 ~ 20;
执行恢复 检查全备恢复后的数据,这样就恢复到了周一的数据; 接下来再恢复周2的数据;
七、物理备份 所谓物理备份,最直接的就是将MySQL中的数据库文件复制出来,这种方式简单粗暴,速度也快,比较省事, 比如在上面创建了一个mydb的数据库,在mysql的数据目录下就存在下面几个数据文件; 但是这种方式并不是特别推荐,一方面在不同的操作系统下,数据目录有所不同,其次,这种备份的操作往往需要停服和锁表,以避免外部的操作给备份数据时带来的不一致的影响,另外,与mysql所使用的数据库引擎也很有关系; 八、表的导出与导入 在一些场景下,直接将数据库数据被分成sql文件可能并不是一个特别好的选择,因为导出来的文件格式不够通用,比如还有其他的数据分析平台需要使用这些数据的话,就比较麻烦了,这时候就可以考虑将数据库以文件的形式导出; 表的导出操作 1、 使用SELECT…INTO OUTFILE导出文本文件 将shake_date库下的t_user表数据导出到文件
打开该文件检查下 2. 使用mysqldump命令导出文本文件 使用mysqldump命令将将shake_date数据库中tuser表中的记录导出到文本文件:
检查下文件 使用mysqldump将shake_date数据库中的t_user表导出到文本文件,使用FIELDS选项,要求字段之间使用逗号“,”间隔,所有字符类型字段值用双引号括起来;
可以检查下txt文件,这种格式的数据在很多大数据处理业务场景中是一种比较好的数据格式 3、使用mysql命令导出文本文件
导出的结果格式如下 使用 --veritcal 参数将该条件记录分为多行显示
得到的数据格式如下 使用--xml参数将数据导出为xml格式
表的导入操作 上面演示了将表以各自类型格式的文件导入,下面再看看如何将不同格式的表的数据进行导入操作; 1. 使用LOAD DATA INFILE方式导入文本文件 使用 SELECT...INTO OUTFILE 将 shake_date 数据库中 t_user 表的记录导出到文本文件 执行下面的语句导出
删除t_user表的数据 从文本文件tuser1.txt中恢复数据
2、将上面以逗号分割的文件导入到数据表 使用如下语句
导入之前先清理下表的数据 3、使用mysqlimport方式导入文本文件 仍然以上面的那个以逗号分割的文件为例进行说明 先清理数据表 执行下面的语句进行数据导入
执行完成后,可以看到数据又恢复了; (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |