如何使用 pg_dump 和 pg_restore 备份和恢复数据库

你需要一个可以真正恢复的 PostgreSQL 备份，而不仅仅是一个看起来像备份的文件。pg_dump 和 pg_restore 是逻辑备份的标准工具：它们将数据库对象和数据复制到可移植的转储文件中，然后稍后在相同服务器、测试服务器或新的 PostgreSQL 实例上重建它们。

本指南专注于单数据库逻辑备份。对于整个集群的灾难恢复、时间点恢复或非常大的安装，请结合物理备份和 WAL 归档使用。

理解 pg_dump

pg_dump 连接到一个数据库并导出其模式和数据。它不会转储角色、表空间或全局集群对象；当需要这些时，请使用 pg_dumpall --globals-only。

pg_dump 支持多种输出格式：

以下是 pg_dump 最常用的一些选项：

要创建名为 mydatabase 的数据库的纯文本备份，该数据库由用户 myuser 拥有，并保存为 mydatabase_backup.sql：

pg_dump -U myuser -f mydatabase_backup.sql mydatabase

如果需要指定主机和端口：

pg_dump -h localhost -p 5432 -U myuser -f mydatabase_backup.sql mydatabase

根据你的身份验证方法，这可能会提示输入 myuser 的密码。

自定义格式是许多生产备份的良好默认选择，因为它与 pg_restore 配合使用并支持选择性恢复。

pg_dump -U myuser -Fc -f mydatabase_backup.dump mydatabase

这将创建 mydatabase_backup.dump，格式适合 pg_restore。

对于大型数据库，并行转储可以减少备份时间。它需要目录格式：

pg_dump -U myuser -Fd -j 4 -f mydatabase_backup_dir mydatabase

此命令将创建一个名为 mydatabase_backup_dir 的目录，其中包含多个文件，并使用 4 个并行作业。

pg_restore 恢复由 pg_dump 创建的自定义、目录或 tar 归档。纯 SQL 文件使用 psql 恢复，而不是 pg_restore。

如果你使用 pg_dump 创建了纯文本 SQL 备份（例如 mydatabase_backup.sql），则使用 psql 恢复：

psql -U myuser -d mydatabase -f mydatabase_backup.sql

如果备份文件包含来自 pg_dump --create 的 CREATE DATABASE 和 \connect 命令，则连接到维护数据库，例如 postgres：

psql -U myuser -f mydatabase_backup.sql postgres

要将自定义格式备份 mydatabase_backup.dump 恢复到名为 restored_db 的数据库中：

pg_restore -U myuser -d restored_db mydatabase_backup.dump

如果归档是使用 pg_dump --create 创建的，你可以让 pg_restore 创建转储的数据库。-d 值必须是用于初始连接的现有数据库，而不是正在创建的新数据库：

pg_restore -U myuser --create -d postgres mydatabase_backup.dump

这将创建转储中命名的数据库并恢复其中。如果要恢复到不同名称的数据库，请先创建该数据库，然后在不使用 --create 的情况下恢复：

createdb -U myuser restored_db
pg_restore -U myuser -d restored_db mydatabase_backup.dump

为了加快恢复速度，特别是对于大型数据集，请使用 -j 选项：

pg_restore -U myuser -d restored_db -j 4 mydatabase_backup.dump

这将使用 4 个工作作业进行恢复。当转储包含多个独立对象需要加载和索引时，并行恢复最有用。

要恢复以目录格式创建的备份（例如 mydatabase_backup_dir）：

pg_restore -U myuser -d restored_db -j 4 mydatabase_backup_dir

注意最后一个参数是目录路径。

使用 pg_dump -Fc 进行灵活的单文件备份，使用 pg_dump -Fd -j 进行并行转储，使用 psql 进行纯 SQL 恢复，使用 pg_restore 进行归档恢复。然后通过在紧急情况发生之前恢复到测试数据库来验证该过程。