需要合并的多个PG数据库表个数和结构一致,这里提供一种思路,选择sql语句insert插入的方式进行,即将其他PG数据库的每个表内容插入到一个PG数据库中完成数据库合并
示例代码说明:
选择一个数据库导出表结构为.sql文件(可借助Navicat工具),在此基础上修改.sql内容加入insert语句和dblink语句,数据可能存在重复需要在每个insert插入语句后带上ON CONFLICT DO NOTHING; 数据库名设置为一个通用变量,修改好后的.sql文件就是一个样本文件。复制一个pg数据库并修改名称作为总库,总库需要添加dblink扩展,批量将.sql样本文件中的数据库名替换为其他要合并的数据库名并另存为新的.sql文件,再批量执行每个.sql文件即可。.sql文件修改另存可参考文章:【数据处理_Python】使用python脚本将模板文件修改内容后重命名另存为新文件
import psycopg2
import subprocess
import os
def publicsql(old_string,input_sql,input_dir,output_dir):
with open(input_sql, 'r') as infile:
content = infile.read()
for filename in os.listdir(input_dir):
if filename.endswith('.sql'):
nameparts = filename.split('.')
new_string = nameparts[0]
# 执行替换操作
new_content = content.replace(old_string, new_string)
# 写入新文件
output_file_path = os.path.join(output_dir, new_string + '.sql')
with open(output_file_path, 'w') as oufile:
oufile.write(new_content)
oufile.close()
infile.close()
# 要替换的字段
old_string = "database"
# 样本文件
input_sql = r'E:\test\public.sql'
# 读取替换字段文件路径
input_dir = 'E:/test/chongqinghq/'
# 修改文件后输出路径
output_dir = 'E:/test/publicsql/'
publicsql(old_string,input_sql,input_dir,output_dir)
#数据库连接信息
database_name = 'hqdb_500100_20241112' #总库名称
username = 'postgres'
password = 'postgres'
host = 'localhost'
port = '5432'
os.environ['PGPASSWORD'] = password
# 获取文件夹下所有.sql文件名称
filenames = os.listdir(output_dir)
# 遍历文件列表
for filename in filenames:
output_file = output_dir + filename
commandimport = f'D:/Program Files/PostgreSQL/10/bin/psql -h {host} -p {port} -U {username} -d {database_name} -f {output_file}'
subprocess.run(commandimport, check=True)
print(f"Database {filename} was successfully imported into Database {database_name}")
输出结果示例:

.sql样本文件示例:


















