PyTorch 搭建CNN网络模型 手写数字识别 模型保存及加载

PyTorch 搭建CNN网络模型 手写数字识别 模型保存及加载

import torch
import torch.nn as nn
from torch.autograd import Variable
import torch.utils.data as Data
import torchvision
import matplotlib.pyplot as plt
import os

# 批训练加速模型的训练速度
EPOCH = 1  # 定义批次训练的batch数
BATCH_SIZE = 50  # 定义批次训练的batch大小

LR = 0.001  # 学习率,学习率越高模型训练速度越快,但对应得会损失精度

# 下载训练集
train_data = torchvision.datasets.MNIST(
    root='./data',
    train=True,                                     # 是true下载训练集,如果是false 则下载测试集
    transform=torchvision.transforms.ToTensor(),    # Converts a PIL.Image or numpy.ndarray to
                                                    # torch.FloatTensor of shape (C x H x W) and normalize in the range [0.0, 1.0]
                                                    # 载下来的数据转化为tensor格式(0-1),原始数据是pxl(0-255)
    download=True,
)

train_loader = Data.DataLoader(dataset=train_data, batch_size=BATCH_SIZE, shuffle=True)

# 查看数据规模
print(train_data.data.size())
print(train_data.targets.size())
# 查看一张数据
#plt.imshow(train_data.data[0].numpy(), cmap='gray')
#plt.title('%i' % train_data.targets[0])
#plt.show()


# 下载测试集
test_data = torchvision.datasets.MNIST(root='./data', train=False)  # 数据还是0-255之间
# print('test_data', test_data.data[:1].shape)
# torch.Size([1, 28, 28])
test_x = torch.unsqueeze(test_data.data, dim=1).type(torch.FloatTensor)[:2000]/255.  # 该操作把255数据压缩到0-1之间
# print('test_x', test_x[:1].shape)
# test_x torch.Size([1, 1, 28, 28])
test_y = test_data.targets[:2000]


# 搭建CNN网络模型
# 当我们自己实现类的话,必须继承自nn.Module,并且在init中完成初始化的步骤和forward中完成计算图的前向构建的过程。
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()  # 父类初始化
        self.conv1 = nn.Sequential(
            # 卷积+激活+池化
            # 过滤器  高度-filter 用于提取出卷积出来的特征的属性
            # 图片的维度是 (1,28,28) 1 是channel的维度,28x28的宽高
            nn.Conv2d(
                1,  # in_channels=1 输入的通道
                16, # out_channels=16 输出的通道(filter的个数)
                5,  # kernel_size=5,filter的宽高都是5个像素点
                1,  # stride=1,卷积步长
                2,  # padding=2填充,如果想输出的和输入的宽高尺寸一样则需要padding=(kernel_size-1)/2
            ),  # (16,28,28)
            nn.ReLU(),
            # 筛选重要信息 kernel_size=2 把2x2的区域中选最大的值变成1x1
            nn.MaxPool2d(kernel_size=2),  # (16,14,14)
        )
        # (16,14,14)
        self.conv2 = nn.Sequential(
            nn.Conv2d(16, 32, 5, 1, 2),  # (32,14,14)
            nn.ReLU(),
            # 一般用最大值
            nn.MaxPool2d(2),  # (32,7,7)
        )
        # 输出层
        self.out = nn.Linear(32 * 7 * 7, 10)  # (a,b)a是数据维度 b是分类器有十个

    def forward(self, x):
        x = self.conv1(x)
        x = self.conv2(x)  # (batch,32,7,7)
        x = x.view(x.size(0), -1)  # view:将数据变成全连接网络(-1:自动检测矩阵有有多少行,列指定为x.size(0))

        output = self.out(x)

        return output


# 模型实例
cnn = CNN()
print(cnn)

'''
# 模型优化和训练
optimizer = torch.optim.Adam(cnn.parameters(), lr=LR)  # 优化器
loss_func = nn.CrossEntropyLoss()  # 损失函数。项目内容本质上是分类问题,针对多分类问题一般用交叉熵,因为它计算的是一个概率。

# 训练过程
for epoch in range(EPOCH):
    for step, (x, y) in enumerate(train_loader):
        b_x = Variable(x)  # 需要把X,Y使用Variable转化为pytorch能处理的张量形式
        b_y = Variable(y)

        output = cnn(b_x)
        loss = loss_func(output, b_y)  # 计算损失函数
        optimizer.zero_grad()  # 清空过往梯度
        loss.backward()        # 反向传播,计算当前梯度
        optimizer.step()       # 根据梯度更新网络参数

        if step % 50 == 0:
            test_output = cnn(test_x)
            pred_y = torch.max(test_output, 1)[1].data.squeeze()
            accuracy = sum(pred_y == test_y) / test_y.size(0)
            print('Epoch: ', epoch, '| train loss: %.4f' % loss.data.numpy(), '| test accuracy: %.2f' % accuracy)


# 保存模型
#torch.save(cnn, './model/cnn.pkl')
'''

# 加载模型
cnn_model = CNN()
cnn_model = torch.load('./model/cnn.pkl')
cnn_model.eval()

# 验证识别成功率
test_output = cnn_model(test_x[:30])
pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze()
print('真实值', test_y[:30].data.numpy().squeeze())
print('预测值', pred_y)

'''
# 验证识别成功率
test_output = cnn(test_x[:10])
# print('test_output 0', test_output)
# print('test_output 1', torch.max(test_output, 1))

# a0 = torch.max(a, dim)
# 其中a为一个tensor
# dim的值为0/1,分别代表索引每列/行最大值
# 返回的值包含两个数据(values, indices) 分别代表最大值的值和所在的索引
# torch.max(a, 1)[1] 代表a中每行最大值的索引
# print('test_output 2', torch.max(test_output, 1)[1].data.numpy())
# numpy.squeeze() 这个函数的作用是去掉矩阵里维度为1的维度。
# 例如 (1, 5)的矩阵经由np.squeeze处理后变成5
# (5, 1, 6)的矩阵经由np.squeeze处理后变成(5, 6)
pred_y = torch.max(test_output, 1)[1].data.numpy().squeeze()
print('真实值', test_y[:10].squeeze())
print('预测值', pred_y)

'''

 

发表回复

您的电子邮箱地址不会被公开。