02 Deep learning神经网络的编程基础逻辑回归--吴恩达

news2025/12/25 11:23:51

逻辑回归

逻辑回归是一种用于解决二分类任务（如预测是否是猫咪等）的统计学习方法。尽管名称中包含“回归”，但其本质是通过线性回归的变体输出概率值，并使用Sigmoid函数将线性结果映射到[0,1]区间。

以猫咪预测为例

假设单个样本/单张图片为（ $\mathbf{x}$ ， $\mathbf{y}$ ），特征向量X = $\mathbf{x}$ ，则 $\hat{y}$ 即为X的预测值， $\hat{y}$ =P（y= $\mathbf{y}$ / $\mathbf{x}$ ）, $\hat{y}$ ∈（0,1）。
假设特征权重参数为 $\mathbf{w}$ ，是一个n_x维的向量，则有：
$\hat{y}$ = $\sigma$ （ $w^\top$ $\mathcal{x}$ + $\mathcal{b}$ ）
$\mathcal{z}$ = $w^\top$ $\mathcal{x}$ + $\mathcal{b}$
$\hat{y}$ = $\sigma（z）$

Sigmoid函数

Sigmoid函数是一种常用的S型激活函数，数学表达式为：
$\sigma(z) = \frac{1}{1 + e^{-z}}$
在这里插入图片描述
机器学习便是学习参数 $\mathcal{x}$ 和 $\mathcal{b}$ ，使得 $\hat{y}$ 尽可能接近实际值 $\mathcal{y}$ 。

符号惯例介绍

定义一个额外特征向量 $\mathcal{x_0}$ =1，
$\hat{y}$ = $\sigma$ ( $\theta^{T}$ $\mathcal{x}$ )，其中 $\theta_0$ 充当 $\mathcal{b}$ ，其余 $\theta_1$ 到 $\theta_{nx}$ 充当 $\mathbf{w}$

核心特性

输出范围：$ (0,1) $，适合概率映射
单调性：全程可导且导数最大值为$ 0.25 $（出现在$ x=0$处）
导数特性： $\sigma'(x) = \sigma(x)(1 - \sigma(x))$ ，便于梯度计算

Python实现

import numpy as np

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 支持向量化计算
print(sigmoid(np.array([-1.0, 0.0, 1.0])))  # 输出：[0.2689, 0.5, 0.7311]

典型应用

逻辑回归中的概率转换
神经网络隐藏层的激活函数
强化学习中的动作选择概率

局限说明

深层网络易出现梯度消失（导数值随网络深度指数衰减）
输出不以零为中心可能影响优化效率
现多被ReLU系列函数替代用于隐藏层

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2402451.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！