pytorch模型转onnx的动态batch转换说明

news2025/11/1 7:18:45

将PyTorch模型（.pth）转换为ONNX格式时，通常需要指定一个batch size。这是因为ONNX模型需要一个固定的输入形状，而批处理大小是输入形状的一部分。

下面是一个简单的转换示例，假设你已经加载了一个PyTorch模型：

import torch

# 加载你的模型
model = torch.load('path_to_your_model.pth')
model.eval()  # 设置为评估模式

# 创建一个示例输入张量，指定batch size（例如，batch size为1，输入大小为3x224x224）
batch_size = 1
dummy_input = torch.randn(batch_size, 3, 224, 224)

# 指定导出ONNX文件的路径
onnx_file_path = 'model.onnx'

# 导出模型
torch.onnx.export(model, dummy_input, onnx_file_path, 
                  export_params=True, 
                  opset_version=11,  # 根据需要指定ONNX的opset版本
                  do_constant_folding=True,  # 是否进行常量折叠优化
                  input_names=['input'],  # 输入名
                  output_names=['output'],  # 输出名
                  dynamic_axes={'input': {0: 'batch_size'},  # 指定动态批处理大小
                                'output': {0: 'batch_size'}})

关键点

batch size：在创建示例输入张量时指定的。
dynamic_axes：允许在ONNX模型中使用动态的批处理大小，使得模型可以处理不同大小的批次。

确保模型输入形状和需求调整输入张量的维度和名称。

如果导出ONNX模型时使用了dynamic_axes参数，模型就可以处理不同的batch size，包括60的场景。

在上面的示例中，dynamic_axes定义了输入和输出的第一维（batch size）是动态的，这意味着在推理时，你可以使用任意大小的batch：

dynamic_axes={
    'input': {0: 'batch_size'},  # 输入的第0维（batch size）是动态的
    'output': {0: 'batch_size'}   # 输出的第0维（batch size）也是动态的
}

如何在推理时使用不同的batch size

在运行ONNX模型推理时，你可以使用任意的batch size。例如，在使用onnxruntime进行推理时：

import onnxruntime as ort
import numpy as np

# 创建ONNX运行时环境
session = ort.InferenceSession('model.onnx')

# 创建示例输入数据，假设batch size为60
batch_size = 60
input_data = np.random.randn(batch_size, 3, 224, 224).astype(np.float32)  # 根据模型的输入形状调整

# 执行推理
outputs = session.run(['output'], {'input': input_data})

# 处理输出
print(outputs)