【Postgres_Python】使用python脚本将多个PG数据库合并为一个PG数据库

news2026/5/18 12:14:01

需要合并的多个PG数据库表个数和结构一致，这里提供一种思路，选择sql语句insert插入的方式进行，即将其他PG数据库的每个表内容插入到一个PG数据库中完成数据库合并

示例代码说明：

选择一个数据库导出表结构为.sql文件（可借助Navicat工具），在此基础上修改.sql内容加入insert语句和dblink语句，数据可能存在重复需要在每个insert插入语句后带上ON CONFLICT DO NOTHING; 数据库名设置为一个通用变量，修改好后的.sql文件就是一个样本文件。复制一个pg数据库并修改名称作为总库，总库需要添加dblink扩展，批量将.sql样本文件中的数据库名替换为其他要合并的数据库名并另存为新的.sql文件，再批量执行每个.sql文件即可。.sql文件修改另存可参考文章：【数据处理_Python】使用python脚本将模板文件修改内容后重命名另存为新文件

import psycopg2
import subprocess
import os
def publicsql(old_string,input_sql,input_dir,output_dir):
    with open(input_sql, 'r') as infile:
        content = infile.read()
        for filename in os.listdir(input_dir):
            if filename.endswith('.sql'):
                nameparts = filename.split('.')
                new_string = nameparts[0]
                # 执行替换操作
                new_content = content.replace(old_string, new_string)
                # 写入新文件
                output_file_path = os.path.join(output_dir, new_string + '.sql')
                with open(output_file_path, 'w') as oufile:
                    oufile.write(new_content)
                oufile.close()
    infile.close()
# 要替换的字段
old_string = "database"
# 样本文件
input_sql = r'E:\test\public.sql'
# 读取替换字段文件路径
input_dir = 'E:/test/chongqinghq/'
# 修改文件后输出路径
output_dir = 'E:/test/publicsql/'
publicsql(old_string,input_sql,input_dir,output_dir)
#数据库连接信息
database_name = 'hqdb_500100_20241112' #总库名称
username = 'postgres'
password = 'postgres'
host = 'localhost'
port = '5432'
os.environ['PGPASSWORD'] = password
# 获取文件夹下所有.sql文件名称
filenames = os.listdir(output_dir)
# 遍历文件列表
for filename in filenames:
        output_file = output_dir + filename
        commandimport = f'D:/Program Files/PostgreSQL/10/bin/psql -h {host} -p {port} -U {username} -d {database_name} -f {output_file}'
        subprocess.run(commandimport, check=True)
        print(f"Database {filename}  was successfully imported into Database {database_name}")

输出结果示例：