MATLAB实现GAN用于图像分类

news2025/5/21 7:17:59

生成对抗网络（GAN）是一种强大的生成模型，由生成器（Generator）和判别器（Discriminator）组成。生成器用于生成图像，判别器用于判断图像是真实的还是生成的。在MATLAB中实现GAN用于图像分类和生成需要一些准备工作，包括数据预处理、网络定义、训练和测试等步骤。

1. 数据准备

假设我们使用MNIST数据集，这是一个包含手写数字的灰度图像数据集。

% 加载MNIST数据集
data = digitDatasetPath;
imds = imageDatastore(data, 'IncludeSubfolders', true, 'LabelSource', 'foldernames');
[imdsTrain, imdsTest] = splitEachLabel(imds, 0.8, 'randomized');

% 数据预处理
preprocessFcn = @(x) imresize(x, [28 28]) / 255.0;
imdsTrain.ReadFcn = @(x) preprocessFcn(x);
imdsTest.ReadFcn = @(x) preprocessFcn(x);

2. 定义生成器和判别器

生成器和判别器可以使用MATLAB的深度学习工具箱中的层定义。

生成器

numLatentInputs = 100; % 潜在空间的维度
numImageRows = 28;
numImageCols = 28;
numChannels = 1;

layersG = [
    featureInputLayer(numLatentInputs, 'Name', 'input')
    fullyConnectedLayer(7*7*256, 'Name', 'fc1')
    reluLayer('Name', 'relu1')
    reshapeLayer([7 7 256], 'Name', 'reshape1')
    transposedConv2dLayer(5, 128, 'Stride', 2, 'Cropping', 2, 'Name', 'tconv1')
    reluLayer('Name', 'relu2')
    transposedConv2dLayer(5, 64, 'Stride', 2, 'Cropping', 2, 'Name', 'tconv2')
    reluLayer('Name', 'relu3')
    transposedConv2dLayer(5, numChannels, 'Stride', 1, 'Cropping', 2, 'Name', 'tconv3')
    tanhLayer('Name', 'tanh')];

判别器

layersD = [
    imageInputLayer([numImageRows numImageCols numChannels], 'Name', 'input')
    convolution2dLayer(5, 64, 'Stride', 2, 'Padding', 2, 'Name', 'conv1')
    leakyReluLayer(0.2, 'Name', 'leakyrelu1')
    convolution2dLayer(5, 128, 'Stride', 2, 'Padding', 2, 'Name', 'conv2')
    leakyReluLayer(0.2, 'Name', 'leakyrelu2')
    fullyConnectedLayer(1, 'Name', 'fc')
    sigmoidLayer('Name', 'sigmoid')];

3. 定义训练循环

训练GAN需要交替训练生成器和判别器。

% 定义训练参数
numEpochs = 100;
miniBatchSize = 128;
learningRate = 0.0002;
beta1 = 0.5;
beta2 = 0.999;

% 创建训练选项
options = trainingOptions('adam', ...
    'MaxEpochs', numEpochs, ...
    'MiniBatchSize', miniBatchSize, ...
    'InitialLearnRate', learningRate, ...
    'GradientDecayFactor', beta1, ...
    'SquaredGradientDecayFactor', beta2, ...
    'Shuffle', 'every-epoch', ...
    'Verbose', false);

% 训练GAN
netG = trainNetwork(imdsTrain, layersG, options);
netD = trainNetwork(imdsTrain, layersD, options);

4. 生成图像

训练完成后，可以使用生成器生成图像。

% 生成随机噪声
numSamples = 16;
latentInputs = randn(numSamples, numLatentInputs);

% 使用生成器生成图像
generatedImages = predict(netG, latentInputs);

% 显示生成的图像
figure;
for i = 1:numSamples
    subplot(4, 4, i);
    imshow(generatedImages(:, :, :, i), 'InitialMagnification', 'fit');
    axis off;
end