【漫话机器学习系列】240.真正类率(True Positive Rate,TPR)

news2025/5/9 14:40:16


理解真正类率(True Positive Rate,TPR):公式、意义与应用

在机器学习与深度学习模型评估中,"真正类率"(True Positive Rate,简称TPR)是一个非常重要的指标。TPR反映了分类器对正样本识别能力的强弱,也常常被称为召回率(Recall)灵敏度(Sensitivity)

今天我们通过一张非常直观的图片,来深入理解TPR的定义、公式推导、实际应用场景,并探讨其与其他评估指标的关系。

什么是真正类率(TPR)?

真正类率(TPR) 衡量的是模型对实际为正的样本识别正确的比例。
直观地讲,它回答了这样一个问题:

在所有真实为正的样本中,有多少被正确地识别出来了?

如果一个模型能够将所有正样本都正确分类为正,那么它的TPR就是100%。

TPR的数学公式

根据上面提供的图片,TPR的公式可以写成:

TPR=真正类真正类+假负类\text{TPR} = \frac{\text{真正类}}{\text{真正类} + \text{假负类}}

但是,图片里公式写成了另一种变形,稍有误导。让我们来细致地拆解一下:

  • 真正类(True Positive,TP):模型正确预测为正的样本数量。

  • 假负类(False Negative,FN):实际为正但被错误预测为负的样本数量。

因此标准的TPR公式应该是:

图片中提到的“假正类”其实是False Positive(FP),应该注意区分。

如果按照图片的公式(真正类 / (真正类 + 假正类)),其实描述的是**精准率(Precision)**而不是TPR。
所以,总结:真正类率(TPR)= 真正类 / (真正类 + 假负类)

✅ 正确的TPR公式是基于假负类而不是假正类


为什么TPR很重要?

在某些应用场景中,漏掉真正的正样本是非常严重的错误。例如:

  • 疾病检测:将一个患病患者预测为健康(假负类)可能导致严重后果。

  • 欺诈检测:漏掉一个真实欺诈行为(假负类)可能带来经济损失。

  • 安全检查:漏检危险品可能导致安全事故。

因此,在这些场景中,我们希望TPR尽可能高,确保真正的正样本都能被识别出来。


举个例子

假设我们做了一个癌症检测模型,检测了100个病人,真实情况如下:

  • 30个病人确实患有癌症(正样本)。

  • 70个病人没有癌症(负样本)。

模型的预测结果:

  • 成功检测出25个患癌者(True Positive = 25)。

  • 漏掉5个患癌者,误判为健康(False Negative = 5)。

那么TPR就是:

\text{TPR} = \frac{25}{25+5} = \frac{25}{30} \approx 0.8333

即,模型的真正类率是83.33%,意味着83.33%的癌症患者被成功检测出来了。


TPR与其他指标的关系

在模型评估中,TPR通常不会单独使用,而是和其他指标一起分析,比如:

指标公式含义
精准率(Precision)\frac{TP}{TP+FP}预测为正的样本中,正确的比例
召回率(Recall/TPR)\frac{TP}{TP+FN}实际为正的样本中,预测正确的比例
F1分数(F1 Score)2 \times \frac{Precision \times Recall}{Precision + Recall}综合考虑精准率和召回率

通常在精度(Precision)和召回率(Recall)之间存在权衡:

  • 提高召回率,可能会降低精准率;

  • 提高精准率,可能会降低召回率。

因此,实际应用中要根据业务需求选择最合适的指标。


总结

  • TPR(True Positive Rate)也叫召回率(Recall)或灵敏度(Sensitivity)。

  • 正确公式是:TPR = 真正类 / (真正类 + 假负类)

  • TPR用于衡量模型正确识别正样本的能力。

  • 在医疗、金融安全等领域,TPR至关重要。

希望通过这篇文章,你对TPR有了更系统深入的理解!


附录:错误提示

⚠️ 图片中使用了“假正类(False Positive)”来计算TPR,这在严谨的定义中是错误的。
正确的TPR公式应该涉及假负类(False Negative)

大家在学习过程中,务必注意区分**假正类(FP)假负类(FN)**的不同概念哦!


如果你觉得这篇文章对你有帮助,欢迎点赞收藏!如果有疑问或者想继续了解其他评估指标(比如ROC曲线、AUC指标等),可以在评论区告诉我~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2371547.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux的基础开发工具

目录 前言: 1、包管理器yum 1.1 软件包的依赖 1.2 镜像源 1.3 查找/安装/卸载软件 2、编辑器vim 2.1 命令模式(默认) 2.1.1 撤销与反撤销 2.1.2 光标定位 2.1.3 复制&&剪切(删除)&&粘贴 2.1.4 替换 2.1.5 插入模式 2.1.6 V-Block模式 …

【Electron】electron-vue 借助 element-ui UI 库助力桌面应用开发

前面文章我们讲过 electron 让可以用 HTML、JS、CSS 开发桌面应用程序。而 electron-vue 是一个结合了 electron 与 vue 的套件。这样我们就能方便地使用 vue 快速开发桌面应用。但是,vue 只是在 js 这层面做了大量的便捷的操作。对 UI 并未过多涉及。此时如果您在开…

Linux基础(最常用基本命令)

1.查看文件ls 1.1 格式 ls 选项 参数,如:ls -lah ~/ 1.2 选项设置: -l:list 以列表方式显示文件 -h:human-readable 以人类可读的方式显示文件大小(会将纯数字转换为kb,mb) -a:all 显示所有的…

含铜废水循环利用体系

在工业绿色转型浪潮中,含铜废水回收技术正以"资源再生智能管控"的双核驱动模式,重构传统水处理产业的价值链。该体系通过构建"精准分离-梯级利用-智慧运维"的闭环系统,不仅突破了重金属废水处理的技术桎梏,更…

MySQL 安装配置(完整教程)

文章目录 一、MySQL 简介二、下载 MySQL三、安装 MySQL四、配置环境变量五、配置 MySQL5.1 初始化 MySQL5.2 搭建 MySQL 环境 六、修改 MySQL 密码七、卸载 MySQL八、结语 一、MySQL 简介 MySQL 是一款广泛使用的开源关系型数据库管理系统(RDBMS)&#…

【JavaScript】二十九、垃圾回收 + 闭包 + 变量提升

文章目录 1、作用域1.1 局部作用域1.2 全局作用域1.3 作用域链 2、JC垃圾回收机制♻️3、GC算法3.1 引用计数法3.2 标记清除法 4、闭包4.1 定义4.2 闭包的应用:实现数据的私有 5、变量提升 1、作用域 即一个范围,离开了这个范围,这个变量就不…

【从零开始学习RabbitMQ | 第一篇】从异步通信到交换机

目录 前言 1.什么是RabbitMQ? 2.同步调用的优缺点 3.异步调用的优缺点 3.1优点: 3.2异步调用的问题是什么? 4技术选型 4.1AMQP协议就是: 4.2kafka和RabbitMQ的使用场景 5.安装RabitMq 6.rabitmq的整体架构 7.RabibtM…

AI(学习笔记第二课) 使用langchain进行AI开发

文章目录 AI(学习笔记第二课) 使用langchain进行AI开发学习内容:1. 使用背景2.创建python(pycharm community版)开发环境并连接deepseek2.1 创建python(pycharm community版)开发环境2.2 创建python工程2.3 写入初始py…

基于Jenkins的DevOps工程实践之Jenkins共享库

文章目录 前言Jenkins共享库结构1、共享库演示2、知识点补充3、实践使用共享库格式化输出日志4、groovy基础语法4.1、 什么是 Groovy?4.2、groovy特点4.3、运行方法4.4、标识符4.5、基本数据类型4.5.1、string类型4.5.2、list类型 4.6、函数使用4.7、正则表达式 5、…

使用Qt自带的Qt assistant时如何添加需要查看的文档

当我们双击打开Qt Assistant时 左边目录栏只有自带的帮助文档,所以需要添加要查看的文档 点击左上角Edit中的Preferences,点击add 找到qdoc文件夹 全选里面的内容 点击Apply 点击ok 左边的目录栏就出现所有这个版本的Qt有关的文档啦

基于网络爬虫+Spark+Hadoop等大数据和SpringBoot技术实现的的汽车行业大数据分析与可视化平台系统(源码+论文+PPT+部署文档教程等)

博主介绍:CSDN毕设辅导第一人、全网粉丝50W,csdn特邀作者、博客专家、腾讯云社区合作讲师、CSDN新星计划导师、Java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌ 技术范围…

日本IT|AI应用工程师主要工作内容以及职业前景解析

1. 主要工作内容 AI应用工程师是: 类别具体工作内容常见工具需求分析和业务部门沟通,明确「用AI解决什么问题」PowerPoint, Excel, Miro模型选型与微调用现成AI(如BERT、YOLOv8、Stable Diffusion等)做Fine-TuningPython (PyTor…

Soft Mask(软遮罩)技术

一、概述 Soft Mask是一种技术或工具,主要用于实现平滑的边缘遮罩效果。它在不同的应用领域有不同的实现和定义 1.在Unity UI设计中 SoftMask是一款专为Unity设计的高级遮罩工具,它突破了传统Mask的限制,提供了更为灵活和细腻的UI遮罩解决方案…

ESP32开发之freeRTOS的互斥量

什么是互斥量互斥量的应用场合互斥量的API函数基本代码结构互斥量使用举例递归锁递归锁举例总结什么是互斥量 在freeRTOS中,多个任务访问一块共享资源,会产生竞争现象。 比如马路上只有一个很早以前的电话亭,A、B都想要打电话,然后他们就开始打架了。但是如果A先进去了然…

K8s 资源分类

K8s 资源分类图谱 内置资源的分类 1、工作负载相关: Pod:最小的部署单元,包含一个或多个容器。 Deployment:管理无状态应用的副本和滚动更新。 StatefulSet:适用于有状态应用(如数据库)&#…

基于 Flask的深度学习模型部署服务端详解

基于 Flask 的深度学习模型部署服务端详解 在深度学习领域,训练出一个高精度的模型只是第一步,将其部署到生产环境中,为实际业务提供服务才是最终目标。本文将详细解析一个基于 Flask 和 PyTorch 的深度学习模型部署服务端代码,帮…

【金仓数据库征文】金仓数据库 KES:MySQL 迁移实用指南

我们都知道,现在企业数字化转型那可是势在必行,数据库迁移这事儿就变得特别关键。金仓数据库的 KingbaseES(简称 KES),就给咱从 MySQL 往 KES 迁移数据库提供了一套超好用的方案。下面咱就讲下 咋用金仓数据库来完成这…

多态(c++详细版)

一.多态 1.1 多态的概念 多态(polymorphism)的概念:通俗来说,就是多种形态。多态分为编译时多态(静态多态)和运⾏时多态(动态多态),这⾥我们重点讲运⾏时多态,编译时多态(静态多态)和运⾏时多态(动态多态)。编译时多态(静态多态)主…

数据结构——二叉树和堆(万字,最详细)

目录 1.树 1.1 树的概念与结构 1.2 树相关的术语 1.3 树的表示法 2.二叉树 2.1 概念与结构 2.2 特殊的二叉树 2.2.1 满二叉树 2.2.2 完全二叉树 2.3 二叉树存储结构 2.3.1 顺序结构 2.3.2 实现顺序结构二叉树 2.3.2.1 堆的概念与结构 2.3.2. 2 堆的插入与删除数据…

MATLAB基于格拉姆角场与2DCNN-BiGRU的轴承故障诊断模型

本博客来源于CSDN机器鱼,未同意任何人转载。 更多内容,欢迎点击本专栏目录,查看更多内容。 目录 0 引言 1 格拉姆角场原理 2 2DCNN-BiGRU网络结构 3 应用实例 3.1 数据准备 3.2 格拉姆角场数据提取 3.3 网络模型搭建-重中之重 3.4 …