LOGO OA教程 ERP教程 模切知识交流 PMS教程 CRM教程 开发文档 其他文档  
 
网站管理员

MySQL下200GB大表备份,利用传输表空间解决停服发版表备份问题

freeflydom
2025年4月18日 10:49 本文热度 128

问题背景

在停服发版更新时,需对 200GB 大表(约 200 亿行数据)进行快速备份以预防操作失误。

因为曾经出现过有开发写的发版语句里,UPDATE语句的WHERE条件写错了,原本只需要更新几行数据,最终导致更新了半张表的数据。

MySQL版本是MySQL 8.0.X,为了预防这种情况,需要对某个重要的大表进行预先备份,以便可以及时回滚,及时恢复,及时回退,对于备份方法大概有下面几种:

方案优点缺点
mysqldump  导出简单易用大表导出耗时(200GB 可能需数小时)
CREATE TABLE...SELECT直接 SQL 操作数据复制慢,锁表风险高
表空间 传输秒级备份 ,零数据复制需操作系统权限,依赖文件拷贝
主从复制/延迟复制无需停服,恢复灵活需主从架构,维护成本高

这个场景的核心需求:停服更新的时间非常有限,比如1个小时之内要完成更新。

操作流程

前面两种都比较简单,通过导数据的方法来备份旧表,万一出现问题,可以使用导出来的数据进行快速恢复,第三种方法估计比较少人用,下面是具体操作方法

  1. 源表与备胎表结构

-- 源表(aa)
CREATE TABLE aa (
id int(11) DEFAULT NULL,
  sname VARCHAR(100)
) ENGINE=InnoDB;
-- 备胎表(bb)
CREATE TABLE bb (
id int(11) DEFAULT NULL,
  sname VARCHAR(100)
) ENGINE=InnoDB;
greatsql> INSERTINTO aa SELECT1,"nihao";

2、查看两个表的表ID和表空间ID,可以看到aa表的表ID是1081 表空间ID是13,bb表的表ID是1082 表空间ID是14

greatsql> select * from information_schema.innodb_tables where name='school/aa'\G
*************************** 1. row ***************************
          TABLE_ID: 1081
              NAME: school/aa
              FLAG: 33
            N_COLS: 6
             SPACE: 13
        ROW_FORMAT: Dynamic
     ZIP_PAGE_SIZE: 0
        SPACE_TYPE: Single
      INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.01 sec)
greatsql> select * from information_schema.innodb_tables where name='school/bb'\G
*************************** 1. row ***************************
          TABLE_ID: 1082
              NAME: school/bb
              FLAG: 33
            N_COLS: 6
             SPACE: 14
        ROW_FORMAT: Dynamic
     ZIP_PAGE_SIZE: 0
        SPACE_TYPE: Single
      INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec)

3、备胎表卸载表空间:

greatsql> ALTER TABLE bb DISCARD TABLESPACE;  -- 加锁并生成配置文件

4、源表执行表空间导出:

greatsql> USE school;
greatsql> FLUSH TABLES aa FOR EXPORT;   

5、拷贝表空间文件(ibd和cfg文件),然后重新赋予权限,确保导入表空间时候不会出现问题

$ cd /data/mysql/mysql3306/data/school
$ cp aa.ibd  bb.ibd  
$ cp aa.cfg  bb.cfg
$ chown -R mysql:mysql /data/mysql/mysql3306/data/*

6、在相同数据库下,备胎表导入表空间

greatsql> USE school;
greatsql> UNLOCK TABLES;  
greatsql> ALTER TABLE bb IMPORT TABLESPACE;

7、查询表数据,验证数据一致性

greatsql> USE school;
greatsql> SELECT * FROM bb;
greatsql> SELECT * FROM aa;

查询表数据正常,没有任何问题

greatsql> SELECT * FROM aa;
+------+-------+
| id   | sname |
+------+-------+
|    1 | nihao |
+------+-------+
1 row in set (0.01 sec)
greatsql> SELECT * FROM bb;
+------+-------+
| id   | sname |
+------+-------+
|    1 | nihao |
+------+-------+
1 row in set (0.00 sec)

查看表的数据文件,没什么问题

$ ll
total 228
-rw-r----- 1 mysql mysql 114688 Mar  4 16:51 aa.ibd
-rw-r----- 1 mysql mysql    781 Mar  4 16:52 bb.cfg
-rw-r----- 1 mysql mysql 114688 Mar  4 16:52 bb.ibd

 

8、再次查看两个表的表ID和表空间ID,可以看到aa表的表ID是1081 表空间ID是13(没有变化),bb表的表ID是1083 表空间ID是14(表空间ID已经变了),bb表的表ID变了是防止与现有表冲突


mysql> select * from information_schema.innodb_tables where name='school/aa'\G
*************************** 1. row ***************************
          TABLE_ID: 1081
              NAME: school/aa
              FLAG: 33
            N_COLS: 6
             SPACE: 13
        ROW_FORMAT: Dynamic
     ZIP_PAGE_SIZE: 0
        SPACE_TYPE: Single
      INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec)
mysql> select * from information_schema.innodb_tables where name='school/bb'\G
*************************** 1. row ***************************
          TABLE_ID: 1083
              NAME: school/bb
              FLAG: 33
            N_COLS: 6
             SPACE: 14
        ROW_FORMAT: Dynamic
     ZIP_PAGE_SIZE: 0
        SPACE_TYPE: Single
      INSTANT_COLS: 0
TOTAL_ROW_VERSIONS: 0
1 row in set (0.00 sec)

9、发版更新与回滚

-- 发版操作(示例)
greatsql> UPDATE aa SET sname = 'new_value' WHERE id > 1;

10、如果发版有问题,直接交换表名,最快速度恢复整个表的数据

-- 回滚操作(交换表名)
greatsql> ALTER TABLE aa RENAME TO aa_temp; 
greatsql> ALTER TABLE bb RENAME TO aa; 

总结

整个操作最重要的是第4步,操作系统级别的拷贝就完成了整个表的备份,相比于数据倒来倒去在速度上要快不少。另外,第5步的备胎表也可以不用导入,只有当发现发版出现问题时候,再导入也可以。

这种方法的关键优势如下

  • 直接拷贝 .ibd 文件,无需逐行复制数据。
  • 零锁表时间:FLUSH TABLES tablename FOR EXPORT 仅短暂加锁(秒级)。
  • 快速恢复:通过表名交换实现秒级回滚。

特别适合于这几种场景:无主从架构的单实例环境、大表快速备份、停服时间敏感。

当然,如果有主从架构的话,则更加推荐使用第四种方法,在操作上也更加可控,短时间也能保证能够完成。

转自https://www.cnblogs.com/lyhabc/p/18816226/ 


该文章在 2025/4/18 10:49:52 编辑过
关键字查询
相关文章
正在查询...
点晴ERP是一款针对中小制造业的专业生产管理软件系统,系统成熟度和易用性得到了国内大量中小企业的青睐。
点晴PMS码头管理系统主要针对港口码头集装箱与散货日常运作、调度、堆场、车队、财务费用、相关报表等业务管理,结合码头的业务特点,围绕调度、堆场作业而开发的。集技术的先进性、管理的有效性于一体,是物流码头及其他港口类企业的高效ERP管理信息系统。
点晴WMS仓储管理系统提供了货物产品管理,销售管理,采购管理,仓储管理,仓库管理,保质期管理,货位管理,库位管理,生产管理,WMS管理系统,标签打印,条形码,二维码管理,批号管理软件。
点晴免费OA是一款软件和通用服务都免费,不限功能、不限时间、不限用户的免费OA协同办公管理系统。
Copyright 2010-2025 ClickSun All Rights Reserved