Sigmoid和Softmax共通与区分

news2025/7/14 19:04:23

一、共同点

Softmax以及Sigmoid这两者都是神经网络中的激活函数,将输入非线性化。

都作为神经网络的最后一层,将输出数值转换为概率值。

二、不同点

1、Softmax

S o f t m a x = e x i ∑ j = 1 n e x j Softmax = \frac{e^{x_{i}}}{\sum_{j=1}^{n}e^{x_{j}}} Softmax=j=1nexjexi

img

场景:

  • 对于N分类问题,Softmax输入N个类别的概率( ∑ i = 1 N p i = 1 \sum_{i=1}^{N}p_{i}=1 i=1Npi=1),对应 p i p_{i} pi概率最大的 i i i即为判定的类别。

特性:

  • Softmax得出的是归一化类别概率,真实类别有放大。
  • 零点不可微
  • 负输入梯度为0
  • 非负数且概率和为1,得到不同概率间的相互关联

Tricks:

  • Softmax作为激活函数时会将 e x e^{x} ex替换为 e − x e^{-x} ex防止数值过大而溢出

2、Sigmoid

S i g m o i d = 1 1 + e − x Sigmoid = \frac{1}{1+e^{-x}} Sigmoid=1+ex1

image-20230221182931955

场景:

  • 对于N分类问题,可以确定多个类别(>0.5为1,<0.5为0)

  • 单调递增且其反函数也有递增的性质,此函数也经常被用作神经网络的阈值函数中。 S i g m o i d ′ ( x ) = S i g m o i d ( x ) ⋅ ( 1 − S i g m o i d ( x ) ) Sigmoid'(x)=Sigmoid(x)\cdot(1-Sigmoid(x)) Sigmoid(x)=Sigmoid(x)(1Sigmoid(x))

特性:

  • 对应其值加起来并不为1
  • 梯度平滑,避免梯度跳跃;连续函数,可导可微

缺陷:

  • 横向坐标轴正负无穷的时候,两侧导数为0,造成梯度消失
  • 输出非0时,均值收敛速度慢(容易对梯度造成影响)
  • e的幂次运算比较复杂,训练时间比较长

参考链接:

三分钟认知Softmax和Sigmoid的详细区别

Softmax和Sigmoid函数的区别

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/362360.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第一章 操作系统概述

目录一、什么是操作系统&#xff1f;1、操作系统的概念2、计算系统的构成3、主要作用二、操作系统有哪些功能&#xff1f;1、操作系统的目标2、操作系统的功能三、操作系统有哪些特征&#xff1f;1、并发性2、共享性3、虚拟性4、异步性四、操作系统的运行机制是怎样的&#xff…

uniapp 实时定位(高德、后台运行、支持息屏、坐标转换、距离计算) Ba-LocationAMap

简介&#xff08;下载地址&#xff09; Ba-LocationAMap 是一款基于高德的定位插件。支持实时定位、后台运行、息屏运行等&#xff1b;支持逆地理地址信息&#xff1b;支持坐标转换&#xff1b;支持坐标转换&#xff1b;支持距离计算&#xff1b;支持电池优化白名单。 本插件…

Pod容器

1、Pod基础概念Pod是kubernetes中最小的资源管理组件&#xff0c;Pod也是最小化运行容器化应用的资源对象。一个Pod代表着集群中运行的一个进程。kubernetes中其他大多数组件都是围绕着Pod来进行支撑和扩展Pod功能的&#xff0c;例如&#xff0c;用于管理Pod运行的StatefulSet和…

如何在jmeter中把响应中的数据提取出来并引用

jmeter做接口测试过程中&#xff0c;经常遇到请求需要用到token的时候&#xff0c;我们可以把返回token的接口用后置处理器提取出来&#xff0c;但是在这种情况下&#xff0c;只能适用于当前的线程组&#xff0c;其他线程组无法引用到提取的token变量值&#xff0c;所以必须要生…

数据库三大范式

目录 1.什么是范式 2.为什么使用范式 3.数据库范式类型 4.第一范式 5.第二范式 6.第三范式 1.什么是范式 一些约束、规范、规则 来优化数据库表的设计和存储&#xff0c;这些规则就称为范式。 2.为什么使用范式 遵从不同的规范要求&#xff0c;设计出合理的关系型数据库…

vue中go.js的使用教学(三:创建零部件)

目录 1.介绍 2.创建零部件 一.复杂版 二.简洁版 a.(小复杂版)重写上方复杂版代码&#xff1a; b.&#xff08;优化版&#xff09;重写上方小复杂版 c.这边在加一个扩展&#xff08;GraphObject.make 构建一个 Brush&#xff09; 1.介绍 这边的零部件&#xff0c;指的是每…

破解遗留系统快速重构的5步心法(附实例)

前两天和一个架构师朋友闲聊&#xff0c;说到了 「重构」 这个话题&#xff0c;他们公司早年间上线的项目系统&#xff0c;因一直没专人在演进过程中为代码质量负责&#xff0c;导致现在代码越来越混乱&#xff0c;逐渐堆积成“屎山”&#xff0c;目前的维护成本已远高于重新开…

#贴改色膜前,你必须要知道的事情

关于汽车改色&#xff0c;大多数人都会觉得简单的改个颜色&#xff0c;只是上一层膜而已。但是事实不是这样&#xff0c;改色膜真的不只是看价格和颜色这么简单。最近也有车主来吐槽自己踩过的坑&#xff0c;这篇给大家科普一下&#xff0c;怎么才能避坑&#xff01;一&#xf…

Python os和sys模块

一、os模块 os 模块是 Python中的一个内置模块&#xff0c;也是 Python中整理文件和目录最为常用的模块。 该模块提供了非常丰富的方法用来处理文件和目录。比如&#xff1a;显示当前目录下所有文件/删除某个文件/获取文件大小 1、获取当前的工作路径 在 Python 中&#xff0…

传统巨头生“变”,中国毫米波雷达市场战火再升级

进入2023年&#xff0c;中国车载毫米波雷达市场战火明显升级。 一方面&#xff0c;愈演愈烈的份额抢夺战不仅仅存在于几大传统巨头之间&#xff0c;也快速转移到与国产供应商之间&#xff1b;随着部分外资巨头的本土化战略深入落地&#xff0c;同时对国产供应商造成了压力。 …

多层感知机的区间随机初始化方法

摘要&#xff1a; 训练是构建神经网络模型的一个关键环节&#xff0c;该过程对网络中的参数不断进行微调&#xff0c;优化模型在训练数据集上的损失函数。参数初始化是训练之前的一个重要步骤&#xff0c;决定了训练过程的起点&#xff0c;对模型训练的收敛速度和收敛结果有重要…

mysql -学习总结

mysql 详解1、mysql特点2、事务2.1 事务的四大特性 – ACID2.2 并发事务问题2.3 事务的四大隔离级别2.4 事务隔离级别操作sql2.5 事务原理 – LBCC MVCC2.4.1 行的隐藏列2.4.2 ReadView2.4.3 MVCC在四种隔离级别下的区别2.5 undo log、binlog、redo log2.5.1 Undo log2.5.2 bin…

【BCT_RFC 3927】IPv4 链路本地地址的动态配置

本文件规定了一个因特网标准跟踪协议互联网社区&#xff0c;并请求讨论和建议改进。请参考当前版本的“互联网标准化国家的官方协议标准”&#xff08;STD1&#xff09;和该协议的状态。 抽象的 要参与广域 IP 网络&#xff0c;主机需要为其接口配置 IP 地址&#xff0c;可以通…

10分钟学会使用 Loki 日志聚合系统

Loki 是一个由Grafana Labs 开发的开源日志聚合系统&#xff0c;旨在为云原生架构提供高效的日志处理解决方案。 Loki 通过使用类似 Prometheus 的标签索引机制来存储和查询日志数据&#xff0c;这使得它能够快速地进行分布式查询和聚合&#xff0c;而不需要将所有数据都从存储…

五星好文·射频功率放大器(RF PA)概述

基本概念 射频功率放大器(RF PA)是发射系统中的主要部分&#xff0c;其重要性不言而喻。在发射机的前级电路中&#xff0c;调制振荡电路所产生的射频信号功率很小&#xff0c;需要经过一系列的放大&#xff08;缓冲级、中间放大级、末级功率放大级&#xff09;获得足够的射频功…

面试官:说说你对react生命周期的理解

hello&#xff0c;这里是潇晨&#xff0c;今天我们来看下react生命周期在各个阶段是怎样执行的&#xff0c;在面试的过程中有没有遇到这个问题呢&#xff0c;大家也可以学习往期react源码体系文章哦&#xff0c;往期文章目录在文章结尾。 在之前的react源码介绍中&#xff0c;…

小程序(十)签到业务流程分析

文章目录一、如何获取地理信息&#xff1f;二、如何判定某地区新冠疫情的风险等级&#xff1f;系统的人脸签到模块包含的功能非常丰富&#xff0c;不仅仅只有人脸识别的签到功能&#xff0c;而且还可以根据用户签到时候的地理定位&#xff0c;计算出该地区是 新冠疫情 的 高风险…

ChIP-seq 分析:评估片段长度与处理(6)

1. 片段长度评估 片段长度的预测是 ChIPseq 的重要组成部分&#xff0c;它会影响峰识别、峰识别和覆盖概况。 使用互相关或交叉覆盖可以评估按链进行的读取聚类&#xff0c;从而衡量质量。 fragment在 ChIPseq 中&#xff0c;通常是 dsDNA 的短单端读取。片段的 5 将在“”链上…

C语言入门教程||C语言 函数||C语言 数组

C语言 函数 函数是一组一起执行一个任务的语句。每个 C 程序都至少有一个函数&#xff0c;即主函数 main() &#xff0c;所有简单的程序都可以定义其他额外的函数。 您可以把代码划分到不同的函数中。如何划分代码到不同的函数中是由您来决定的&#xff0c;但在逻辑上&#x…

【YOLOv5】 02-标注图片,训练并使用自己的模型

在上一篇文章中&#xff0c;我们完成了YOLOv5的安装和测试。如果想检测自定义目标&#xff0c;就需要用到LabelImg来对图片打标签&#xff0c;本篇文章介绍了LabelImg安装与使用&#xff0c;以及如何训练并使用自己的模型。一、安装LabelImg输入如下命令进行安装&#xff1a;pi…