PyTorch 线性回归模型构建与神经网络基础要点解析

news2025/5/11 5:33:03

笔记

1 PyTorch构建线性回归模型

1.1 创建数据集

import torch
from torch.utils.data import TensorDataset  # 创建x和y张量数据集对象
from torch.utils.data import DataLoader  # 创建数据集加载器
import torch.nn as nn  # 损失函数和回归函数
from torch.optim import SGD  # 随机梯度下降函数, 取一个训练样本算梯度值
from sklearn.datasets import make_regression  # 创建随机样本, 工作中不使用
import matplotlib.pyplot as plt
​
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
​
​
# todo: 1-创建线性回归样本 x y coef(w) b
def create_datasets():
    x, y, coef = make_regression(n_samples=100,  # 样本数
                                 n_features=1,  # 特征数
                                 noise=10,  # 标准差, 噪声, 样本离散程度
                                 coef=True,  # 返回系数, w
                                 bias=14.5,  # 截距 b
                                 random_state=0)
​
    # 将数组转换成张量
    x = torch.tensor(data=x)
    y = torch.tensor(data=y)
    # print('x->', x)
    # print('y->', y)
    # print('coef->', coef)
    return x, y, coef
​
if __name__ == '__main__':
    x, y, coef = create_datasets()

1.2 训练模型

# todo: 2-模型训练
def train(x, y, coef):
    # 创建张量数据集对象
    datasets = TensorDataset(x, y)
    print('datasets->', datasets)
    # 创建数据加载器对象
    # dataset: 张量数据集对象
    # batch_size: 每个batch的样本数
    # shuffle: 是否打乱样本
    dataloader = DataLoader(dataset=datasets, batch_size=16, shuffle=True)
    print('dataloader->', dataloader)
    # for batch in dataloader:  # 每次遍历取每个batch样本
    #   print('batch->', batch)  # [x张量对象, y张量对象]
    #   break
    # 创建初始回归模型对象, 随机生成w和b, 元素类型为float32
    # in_features: 输入特征数 1个
    # out_features: 输出特征数 1个
    model = nn.Linear(in_features=1, out_features=1)
    print('model->', model)
    # 获取模型对象的w和b参数
    print('model.weight->', model.weight)
    print('model.bias->', model.bias)
    print('model.parameters()->', list(model.parameters()))
    # 创建损失函数对象, 计算损失值
    criterion = nn.MSELoss()
    # 创建SGD优化器对象, 更新w和b
    optimizer = SGD(params=model.parameters(), lr=0.01)
    # 定义变量, 接收训练次数, 损失值, 训练样本数
    epochs = 100
    loss_list = []  # 存储每次训练的平均损失值
    total_loss = 0.0
    train_samples = 0
    for epoch in range(epochs):  # 训练100次
        # 借助循环实现 mini-batch SGD 模型训练
        for train_x, train_y in dataloader:
            # 模型预测
            # train_x->float64
            # w->float32
            y_pred = model(train_x.type(dtype=torch.float32))  # y=w*x+b
            print('y_pred->', y_pred)
            # 计算损失值, 调用损失函数对象
            # print('train_y->', train_y)
            # y_pred: 二维张量
            # train_y: 一维张量, 修改成二维张量, n行1列
            # 可能发生报错, 修改形状
            # 修改train_y元素类型, 和y_pred类型一致, 否则发生报错
            loss = criterion(y_pred, train_y.reshape(shape=(-1, 1)).type(dtype=torch.float32))
            print('loss->', loss)
            # 获取loss标量张量的数值 item()
            # 统计n次batch的总MSE值
            total_loss += loss.item()
            # 统计batch次数
            train_samples += 1
            # 梯度清零
            optimizer.zero_grad()
            # 计算梯度值
            loss.backward()
            # 梯度更新 w和b更新
            # step()等同 w=w-lr*grad
            optimizer.step()
        # 每次训练的平均损失值保存到loss列表中
        loss_list.append(total_loss / train_samples)
        print('每次训练的平均损失值->', total_loss / train_samples)
    print('loss_list->', loss_list)
    print('w->', model.weight)
    print('b->', model.bias)
    
    # 绘制每次训练损失值曲线变化图
    plt.plot(range(epochs), loss_list)
    plt.title('损失值曲线变化图')
    plt.grid()
    plt.show()
​
    # 绘制预测值和真实值对比图
    # 绘制样本点分布
    plt.scatter(x, y)
    # 获取1000个样本点
    # x = torch.linspace(start=x.min(), end=x.max(), steps=1000)
    # 计算训练模型的预测值
    y1 = torch.tensor(data=[v * model.weight + model.bias for v in x])
    # 计算真实值
    y2 = torch.tensor(data=[v * coef + 14.5 for v in x])
    plt.plot(x, y1, label='训练')
    plt.plot(x, y2, label='真实')
    plt.legend()
    plt.grid()
    plt.show()
​
​
if __name__ == '__main__':
    x, y, coef = create_datasets()
    train(x, y, coef)

2 人工神经网络介绍

2.1 什么是人工神经网络

  • 仿生生物学神经网络的计算模型

  • ANN(人工神经网络)->NN(神经网络)

2.2 如何构建人工神经网络

神经网络是由三个层, 每层由多个神经元构成

  • 输入层: 输入样本的特征值, 一层

  • 隐藏层: 提取复杂特征, 可以有多层

  • 输出层: 输出y值, y预测值

2.3 人工神经网络内部状态值和激活值

神经元如何工作

  • 内部状态值(加权求和值)

    • z=w1*x1+w2*x2+...+b

  • 激活值

    • a=f(z)

3 激活函数介绍

3.1 激活函数作用

  • 给神经网络模型中引入非线性因素

  • 生产环境中,问题存在线性不可分情况

3.2 常见激活函数

  • sigmoid激活函数

    • sigmoid激活值范围是[0, 1], 只有正信号, 没有负信号, 模型只能学习到正信号

    • 加权求和值在[-6,6]范围, 计算激活值时分布到[0, 1], 否则激活值只能是0或1

    • sigmoid激活函数导数值范围是[0,0.25], 加权求和值在[-6,6]范围, 激活值梯度才分布到[0, 0.25], 否则梯度为0

    • 神经网络中梯度连乘, sigmoid激活函数梯度值很小, 接近0, 梯度消失 0.25*0.25*0.25*...

    • sigmoid一般在二分类输出层使用, 如果神经网络隐藏层在5层之内也可以考虑使用sigmoid

    # sigmoid激活值: torch.sigmoid(x)
    ​
    import torch
    import matplotlib.pyplot as plt
    ​
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
    ​
    ​
    def dm01():
        # 创建x值, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000)
        # 计算激活值
        y = torch.sigmoid(input=x)
        # 创建画布对象和坐标轴对象
        _, axes = plt.subplots(1, 2)  # 一行两列, 绘制两个子图
        axes[0].plot(x, y)
        axes[0].grid()
        axes[0].set_title('sigmoid激活函数')
    ​
        # 创建x值,可以自动微分, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000, requires_grad=True)
        torch.sigmoid(input=x).sum().backward()
        axes[1].plot(x.detach().numpy(), x.grad)
        axes[1].grid()
        axes[1].set_title('sigmoid激活函数')
        plt.show()
    ​
    ​
    if __name__ == '__main__':
        dm01()

  • tanh激活函数

    • tanh激活值范围是[-1, 1], 既有正信号, 又有负信号, 激活值是以0对称, 模型可以学习到正负信号

    • 加权求和值在[-3,3]范围, 计算激活值时分布到[-1, 1], 否则激活值只能是-1或1

    • tanh激活函数导数值范围是[0,1], 加权求和值在[-3,3]范围, 相比sigmoid激活导数更大, 模型收敛程度更快, 但是如果加权求和值大于3或小于-3, 也是会导致梯度消失, 最好分布在0附近(梯度值最大)

    • tanh激活函数可以在隐藏层使用, 不是优先选择, 浅层神经网络可以使用

    # tanh激活值: torch.tanh(x)
    ​
    import torch
    import matplotlib.pyplot as plt
    from torch.nn import functional as F
    # F.sigmoid()
    # F.tanh()
    ​
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
    ​
    ​
    def dm01():
        # 创建x值, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000)
        # 计算激活值
        y = torch.tanh(input=x)
        # 创建画布对象和坐标轴对象
        _, axes = plt.subplots(1, 2)  # 一行两列, 绘制两个子图
        axes[0].plot(x, y)
        axes[0].grid()
        axes[0].set_title('tanh激活函数')
    ​
        # 创建x值,可以自动微分, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000, requires_grad=True)
        torch.tanh(input=x).sum().backward()
        axes[1].plot(x.detach().numpy(), x.grad)
        axes[1].grid()
        axes[1].set_title('tanh激活函数')
        plt.show()
    ​
    ​
    if __name__ == '__main__':
        dm01()

  • relu激活函数

    • relu激活值范围是[0, x], x是线性输出的正值, 只有正信号

    • 加权求和值大于0, 也可以一部分小于0(神经元死亡, 防止过拟合)

    • relu激活函数导数值0或1, 如果线性输出大于0, 导数为1, 不会出现梯度消失情况, 模型收敛程度更快; 如果线性输出小于0, 神经元死亡, 防止过拟合(选择leaky relu或prelu)

    • relu激活函数优先选择, 计算复杂度最小, 大于0不存在梯度消失情况

    # relu激活值: torch.relu(x)
    ​
    import torch
    import matplotlib.pyplot as plt
    from torch.nn import functional as F
    # F.sigmoid()
    # F.tanh()
    ​
    plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
    ​
    ​
    def dm01():
        # 创建x值, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000)
        # 计算激活值
        y = torch.relu(input=x)
        # torch.leaky_relu()
        # torch.prelu()
        # 创建画布对象和坐标轴对象
        _, axes = plt.subplots(1, 2)  # 一行两列, 绘制两个子图
        axes[0].plot(x, y)
        axes[0].grid()
        axes[0].set_title('relu激活函数')
    ​
        # 创建x值,可以自动微分, 线性模型输出值作为激活函数的输入值
        x = torch.linspace(-20, 20, 1000, requires_grad=True)
        torch.relu(input=x).sum().backward()
        axes[1].plot(x.detach().numpy(), x.grad)
        axes[1].grid()
        axes[1].set_title('relu激活函数')
        plt.show()
    ​
    ​
    if __name__ == '__main__':
        dm01()

  • softmax激活函数

    • 多分类任务的输出层使用, 将输出层加权求和值转换成概率

    import torch
    import pandas as pd
    ​
    ​
    def dm01():
        # 创建输出层加权求和值
        y = torch.tensor(data=[[0.2, 0.02, 0.15, 0.15, 1.3, 0.5, 0.06, 1.1, 0.05, 3.75],
                               [0.2, 0.02, 0.15, 3.75, 1.3, 0.5, 0.06, 1.1, 0.05, 0.15]])
        # softmax激活函数转换成概率值
        # 1轴按列计算
        # y_softmax = torch.softmax(input=y, dim=-1)
        y_softmax = torch.softmax(input=y, dim=1)
        print('y_softmax->', y_softmax)
    ​
    ​
    if __name__ == '__main__':
        dm01()

3.6 如何选择激活函数

  • 隐藏层

    • 优选relu激活函数, 其次选leaky relu/prelu

    • 尽量少使用sigmoid激活函数, 可以使用tanh激活函数代替sigmoid激活函数 浅层神经网络

  • 输出层

    • 二分类问题 sigmoid激活函数

    • 多分类问题 softmax激活函数

    • 回归问题 identity激活函数

4 参数初始化

4.1 参数初始化作用

  • 参数->w和b, 创建初版模型时指定w和b的值

  • 选择合适的参数, 计算得到的加权求和的值会落到激活函数合理的区间, 加快模型收敛速度以及增加不同学习特征值

4.2 常见参数初始化方法

  • 随机初始化

  • 全0、1初始化

  • 固定值初始化

  • kaiming初始化

  • xavier初始化

    import torch
    import torch.nn as nn
    ​
    ​
    # 随机参数初始化
    def dm01():
        # 创建线性层对象, 对线性层的权重进行初始化
        # in_features: 输入神经元个数
        # out_features: 输出神经元个数
        linear1 = nn.Linear(in_features=5, out_features=8)
        linear2 = nn.Linear(in_features=8, out_features=10)
        # 均匀分布初始化,默认在(0,1)区间均匀分布, 可以通过a和b参数调整区间
        nn.init.uniform_(linear1.weight)
        nn.init.uniform_(linear1.weight, a=-1/torch.sqrt(torch.tensor(5.0)), b=1/torch.sqrt(torch.tensor(5.0)))
        nn.init.uniform_(linear1.bias)
        print(linear1.weight)
        print(linear1.bias)
    ​
    ​
    # 正态分布参数初始化
    def dm02():
        # 创建线性层对象, 对线性层的权重进行初始化
        # in_features: 输入神经元个数
        # out_features: 输出神经元个数
        linear1 = nn.Linear(in_features=5, out_features=8)
        linear2 = nn.Linear(in_features=8, out_features=10)
        # 均匀分布初始化
        nn.init.normal_(linear1.weight)
        nn.init.normal_(linear1.bias)
        print(linear1.weight)
        print(linear1.bias)
    ​
    ​
    # nn.init.zeros_()  # 全0初始化
    # nn.init.ones_()  # 全1初始化
    # nn.init.constant_(val=0.1)  # 全固定值初始化
    # nn.init.kaiming_uniform_()  # 凯明均匀分布初始化
    # nn.init.kaiming_normal_()  # 凯明正态分布初始化
    # nn.init.xavier_uniform_()  # xavier均匀分布初始化
    # nn.init.xavier_normal_()  # xavier正态分布初始化
    ​
    ​
    if __name__ == '__main__':
        dm01()
        dm02()

4.3 如何选择参数初始化方法

  • 浅层神经网络可以选择随机初始化

  • 深层神经网络结合激活函数选择

    • tanh激活函数 -> xavier初始化

    • relu激活函数 -> kaiming初始化

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2372879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入解析路由策略:从流量控制到策略实施

一、网络流量双平面解析 在路由策略的设计中,必须明确区分两个关键平面: 1. 控制层面(Control Plane) ​​定义​​:路由协议传递路由信息形成的逻辑平面(如OSPF的LSA、RIP的Response报文)​…

FHE 之 面向小白的引导(Bootstrapping)

1. 引言 FHE初学者和工程师常会讨论的一个问题是; “什么是引导(bootstrapping)?” 从理论角度看,这个问题的答案很简单: 引导就是套用 Gentry 提出的思想——在加密状态下同态地执行解密操作&#xff…

51单片机入门教程——AT24C02数据存储

前言 本教程基于B站江协科技课程进行个人学习整理,专为拥有C语言基础的零基础入门51单片机新手设计。既帮助解决因时间差导致的设备迭代调试难题,也助力新手快速掌握51单片机核心知识,实现从C语言理论到单片机实践应用的高效过渡 。 目录 …

M0的基础篇之PWM学习

一、困惑 上一节课就是单纯的之配置了一个基础的定时器进行计数,计到一定的数值也就是到了一定的时间就进入中断,执行中断里面的任务,也就是一个最基础的定时的功能 这一节课的定时器产生了一个pwm波。也就是我们可以改变里面高电平的持续时间…

Python----神经网络(基于AlexNet的猫狗分类项目)

一、基于AlexNet的猫狗分类 1.1、项目背景 猫和狗是我们生活中最常见的宠物,它们的图像数据大量存在于互联网上。对此进行分类不仅可以帮助开发自动化宠物识别应用,也可以应用于更广泛的计算机视觉领域。例如,训练良好的模型可以支持流浪动物…

荣耀A8互动娱乐组件部署实录(第1部分:服务端环境搭建)

作者:一位被“只支持安卓”的前端劝退过三次的技术人 前言 这一套组件我拆包已经不止一遍了,老实讲,不支持 iOS 是遗憾,但对于研究 UI 动态加载、资源分离结构和整体架构来说,A8 的这套服务还算完整,服务器…

基于Python Flask的深度学习电影评论情感分析可视化系统(2.0升级版,附源码)

博主介绍:✌IT徐师兄、7年大厂程序员经历。全网粉丝15W、csdn博客专家、掘金/华为云//InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇&#x1f3…

计算机学习路线与编程语言选择(信息差)

——授人以鱼不如授人以渔 计算机学习公式:1/3科班思维 1/3路线选择 1/3工程能力 好工作随便找(来自B站小毛毛熊) 本文主要是路线选择!!!下面开始吧。 面向岗位学习!到招聘网站看看有哪些…

【redis】redis 手动切换主从

场景一: 测试需要,需要手动切换主从 在redis节点: $ redis-cli -h xx.xx.xx.xx -p XX -a XX shutdown 不要直接关闭redis进程,使用 shutdown ,能在进程关闭前持久化内存中的数据 待主从切换完毕后&#xff1…

第三节:Vben Admin 最新 v5.0 对接后端登录接口(下)

文章目录 前言一、处理请求头Authorization二、/auth/user/info 接口前端接口后端接口三、/auth/codes 接口1.前端2.后端四、测试接口前言 上一节内容,实现了登录的/auth/login 接口,但是登陆没有完成,还需要完成下面两个接口。才能完成登录。 一、处理请求头Authorizatio…

爬虫学习————开始

🌿自动化的思想 任何领域的发展原因————“不断追求生产方式的改革,即使得付出与耗费精力越来愈少,而收获最大化”。由此,创造出方法和设备来提升效率。 如新闻的5W原则直接让思考过程规范化、流程化。或者前端框架/后端轮子的…

Ubuntu18.04搭建samda服务器

一.什么是Samba服务器? Samba服务器是一种基于开源协议实现的网络共享服务软件,主要用于在不同操作系统(如Windows、Linux、Unix)之间实现文件和打印机共享功能。其核心目标是解决跨平台资源共享的兼容性问题,尤其是在…

2025-05-10-FFmepg库裁切有水印的视频

裁后 代码 import subprocess# 文件路径 input_video_path "bg_video.mp4" output_video_path "output_video_cropped.mp4"# 裁剪视频下方的水印 def crop_video(input_video_path, output_video_path, crop_height):# 获取视频的分辨率def get_video…

opencv+opencv_contrib+cuda和VS2022编译

本文介绍使用OpenCV和OpenCV_Contrib源码及Cuda进行编译的过程,编译过程中会用到OpenCV、OpenCV_Contrib、CUDA Toolkit、cuDNN、Cmake、VS2022等工具,最终编译OpenCV的Cuda版本。 一、OpenCV下载地址 OpenCV官网下载地址:https://opencv.org/releases…

网工实验——OSPF配置

网络拓扑图 配置 1.为每个路由器配置接口(略)(详细见RIP实验) 2.配置OSPF AR1 [AR1]ospf [AR1-ospf-1]area 1 [AR1-ospf-1-area-0.0.0.1]network 172.16.1.1 0.0.0.0 #精确配置网络,也可以像下面那条命令那样配置 …

数据库系统概论-基础理论

数据库系统概述: 1、记录:计算机中表示和存储数据的一种格式或方法。 2、数据库(DataBase, DB):数据库是长期储存在计算机内、有组织、可共享的大量数据集合。可为各种用户共享。 3、数据库管理系统(Dat…

从零开始学习人工智能(Python高级教程)Day6-Python3 正则表达式

一、Python3 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 在 Python 中,使用 re 模块来处理正则表达式。 re 模块提供了一组函数,允许你在字符串中进行模式匹配、搜索和替换操作。 r…

Qt开发:项目视图(Item Views)的介绍和使用

文章目录 一、清单视图(List View)1.1 基本概念1.2 使用示例(文字列表)1.3 图标文字(图标模式)1.4 常用设置1.5 完整示例 二、树视图(Tree View)2.1 基本概念2.2 常用类简介2.3 快速…

keepalived详细笔记

keepalived 是一种基于VRRP(虚拟路由器冗余协议)的高可用解决方案,主要是用于服务器的负载均衡和高可用性的保障,自动将服务切换到备份服务器上,确保业务的连续性。 工作原理: VRRP协议:一组路…

xLua笔记

Generate Code干了什么 肉眼可见的,在Asset文件夹生成了XLua/Gen文件夹,里面有一些脚本。然后对加了[CSharpCallLua]的变量寻找引用,发现它被XLua/Gen/DelegatesGensBridge引用了。也可以在这里查哪些类型加了[CSharpCallLua]。 public over…