机器学习·L2W3-模型评估

news2025/6/24 15:19:04

模型评估

划分数据集为训练集、验证集、测试集

60%训练集、20%测试集和验证集

x_train,x_,y_train,y_=train_test_split(X_train,y_train,test_size=0.4)
x_cv,x_test,y_cv,y_test=train_test_split(x_train,y_train,test_size=0.5)

交叉验证-模型选择

使用交叉验证计算模型的损失 J c v ( w , b ) J_{cv}(w,b) Jcv(w,b)来评估和选择表现最好的模型。
不能使用测试集来选择模型:因为测试集是对模型效果的乐观估计!

模型选择

偏差和方差

回归问题:不是从预测数据和原始数据来看,而主要指的是训练集和验证集的损失
分类问题:分类错误的比例

偏差和方差客观反映了模型的拟合情况:欠拟合和过拟合

在这里插入图片描述

高偏差bias

J t r a i n = J c v 且 J t r a i n 较大 J_{train}=J_{cv}且J_{train}较大 Jtrain=JcvJtrain较大

大小上训练集和验证集差不多,但是训练集的损失较大

高方差variance

J t r a i n < < J c v J_{train}<<J{cv} Jtrain<<Jcv

验证集与训练集的损失有较大出入,且验证集明显大于训练集

正则化

正则化系数 λ \lambda λ越大,拟合曲线就越趋于平缓,偏差越大。

学习曲线

在这里插入图片描述

模型改进

模型改进主要思路是:高偏差就改进拟合的模型,高方差就增多训练集

高偏差

  • 增加训练集大小无用,模型欠拟合
  • 增加更多特征:多项式化数据
  • 减小正则化参数 λ \lambda λ

高方差

  • 增加训练集大小有效减少过拟合情况
  • 减小特征大小
  • 增大正则化参数 λ \lambda λ

神经网络的改进

在这里插入图片描述

高偏差

  • 更大的神经网络

高方差

  • 更多的训练集

迁移学习

在这里插入图片描述

套用别人训练的参数,改进自己的输出层,可以在自己的数据量小的情况下有良好表现
要求输入层特征数二者保持一致,输出层可以改变

*分类评估指标

准确率Accuracy

精确率precision和召回率recall

精确率表征的是预测的准确性
召回率表征的是实际的准确性

在这里插入图片描述

F1-score

一种准确率和召回率的权衡方法,用于评估不同分类模型的效果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1988105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

新来的小姐姐,微软便笺程序打不开了

网管小贾 / sysadm.cc 公司新来了一位小姐姐&#xff0c;听说跟老板沾点关系。 这一天老板出差&#xff0c;午休时大家趁着小姐姐去取外卖&#xff0c;开始了各自的调侃。 部门主管丽姐开了个头&#xff0c;当着众人先抱怨上了。 “你们看看&#xff0c;你们看看&#xff0c;…

国内顶级 AI 的回答令人“贻笑大方”:看来苹果秃头码农们暂时还不会失业吧?

概览 在苹果 App 的日常开发中&#xff0c;利用 Xcode 预览可以帮我们极大的提高界面调试的效率。而且&#xff0c;若能进一步判断出当前 App 是否运行在 Preview 环境中则会更让秃头码农们“笑逐颜开”。 那么到底有没有简单的方法来完成这一任务呢&#xff1f;答案是肯定的…

苹果数据恢复攻略:3大秘籍,助你重建“数据高塔”

在数字时代&#xff0c;苹果设备如iPhone、iPad和Mac已成为我们生活中不可或缺的一部分&#xff0c;存储着大量珍贵的照片、视频、文件和联系信息。然而&#xff0c;意外的删除、系统更新或硬件故障等问题时常威胁着数据的安全。当数据“高塔”崩塌时&#xff0c;苹果数据恢复要…

海量数据处理商用短链接生成器平台 - 6

第十二章 海量数据下的分库分表技术栈讲解 第1集 大话业界常见数据库分库分表中间件介绍 简介&#xff1a; 大话业界常见分库分表中间件介绍 业界常见分库分表中间件 Cobar&#xff08;已经被淘汰没使用了&#xff09;TDDL 淘宝根据自己的业务特点开发了 TDDL &#xff08;T…

基于JSP的智能仓储系统

你好&#xff0c;我是专注于智能系统开发的码农小野。如果对智能仓储系统感兴趣&#xff0c;欢迎私信交流。 开发语言 Java 数据库 MySQL 技术 JSP技术 工具 MyEclipse、Tomcat 系统展示 首页 [插入论文中的系统首页图片] 管理员功能界面 员工功能界面 供应商功能界…

MATLAB代码下载|蚁群算法|计算一元函数最小值

程序总述 程序使用蚁群优化的方法&#xff0c;计算一元函数&#xff08;单输入单输出非线性函数&#xff09;在定义域内的最小值。 函数形式 待计算最小值的函数形式如下&#xff1a; x 4 − 0.2 ∗ c o s ( 3 x ∗ π ) 0.6 x^4 - 0.2 * cos(3x * \pi) 0.6 x4−0.2∗cos…

AI新应用:概要设计与详细设计自动生成解决方案

近日&#xff0c;CoCode旗下的Co-Project智能项目管理平台V4.0.0升级发布&#xff0c;新增AI生成概要设计和AI生成详细设计功能&#xff0c;大大提高了设计的效率和质量。 CoCode旗下的Co-Project智能项目管理平台 一键智绘蓝图自现 平台设计板块新增概要设计功能&#xff0c;…

有点恶心,但是一周可以拿5个大模型岗offer,非常详细收藏我这一篇就够了

一、基础篇目前主流的开源模型体系有哪些&#xff1f; Transformer体系&#xff1a;由Google提出的Transformer模型及其变体&#xff0c;如BERT、GPT等。 PyTorch Lightning&#xff1a;一个基于PyTorch的轻量级深度学习框架&#xff0c;用于快速原型设计和实验。TensorFlow Mo…

同声传译翻译器哪个好?评测5款实用的同声传译翻译器

想象一下&#xff0c;在国际会议中&#xff0c;演讲者的声音刚落&#xff0c;耳机里便响起清晰的母语翻译&#xff1b;或是观看一部外语电影&#xff0c;无需眼睛离开屏幕&#xff0c;字幕就自动以你熟悉的语言呈现——这不再是科幻电影里的桥段&#xff0c;而是现实生活中同声…

猫头虎分享:CSDN博客最多可以创建多少个专栏?

&#x1f42f; 猫头虎分享&#xff1a;CSDN博客最多可以创建多少个专栏&#xff1f; 摘要 &#x1f4cb; 在CSDN博客平台上&#xff0c;不同级别的用户可以创建的专栏数量有所不同。本文将详细介绍CSDN博客创建专栏的具体数量限制&#xff0c;并且对不同等级用户所能创建的专…

武汉流星汇聚:亚马逊赋能中国卖家,全球市场份额优势引领出海潮流

在全球电商的浩瀚星空中&#xff0c;亚马逊无疑是最耀眼的星辰之一&#xff0c;其卓越的市场占有率不仅巩固了自身在全球电商市场的领导地位&#xff0c;更为中国卖家出海提供了前所未有的机遇与优势。随着中国卖家对海外市场的探索日益深入&#xff0c;亚马逊平台以其独特的优…

最新Thinphp开发的证书查询系统源码/开源版/支持自适应多端PC+手机站+含安装教程

源码简介&#xff1a; 最新Thinphp开发的证书查询系统源码&#xff0c;它是开源版&#xff0c;别小看这个开源版&#xff0c;它可是能自动适应各种屏幕大小&#xff0c;不管是用手机还是电脑&#xff0c;都能轻松查证书。附上了安装教程。 这款精心开发用PHP打造的证书查询系…

vue学习--02天

一、数据绑定 !DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><script src&q…

React 知识点(二)

文章目录 一、React 组件二、React 组件通信 - 父子通信三、React 组件通信 - 子父通信四、React 组件通信 - 兄弟通信五、React 组件通信 - 跨组件通信(祖先)六、结合组件通信案例七、props-children 属性八、props-类型校验九、React 生命周期十、setState 扩展 一、React 组…

https证书怎么申请?

申请SSL证书的步骤可以因不同的证书颁发机构&#xff08;CA&#xff09;和证书类型&#xff08;如DV SSL、OV SSL、EV SSL&#xff09;而有所差异。以下是一个通用的SSL证书申请流程&#xff0c;以供参考&#xff1a; 1. 选择SSL证书类型 首先&#xff0c;需要根据您的需求选…

SQLE:你的SQL全生命周期质量管理平台

SQLE&#xff1a;你的SQL全生命周期质量管理平台 在数据库管理领域&#xff0c;总有那么几个难题让人头疼。今天要介绍的SQLE&#xff0c;就是解决这些问题的利器。它不仅支持多种数据库&#xff0c;还能在事前控制、事后监督、标准发布等场景中大显身手。本文将为你详细介绍SQ…

【学习方法】高效学习因素 ② ( 学习动机 | 内在学习动机 | 外在学习动机 | 外在学习动机的调整方向 | 保护学习兴趣 | 高考竞争分析 )

文章目录 一、高效学习的其它因素 - 学习动机1、学习动机2、内在学习动机3、外在学习动机4、外在学习动机的问题所在5、外在学习动机的调整方向6、保护学习兴趣7、高考竞争分析 上一篇博客 【学习方法】高效学习因素 ① ( 开始学习 | 高效学习因素五大因素 | 高效学习公式 - 学…

二十八、【人工智能】【机器学习】- 隐马尔可夫模型 (Hidden Markov Models, HMMs)

系列文章目录 第一章 【机器学习】初识机器学习 第二章 【机器学习】【监督学习】- 逻辑回归算法 (Logistic Regression) 第三章 【机器学习】【监督学习】- 支持向量机 (SVM) 第四章【机器学习】【监督学习】- K-近邻算法 (K-NN) 第五章【机器学习】【监督学习】- 决策树…

SQL时间盲注

目录 1.时间盲注 2使用场景 3.步骤 3.1判断注入点 3.2爆数据库名 3.3爆表名 3.4爆字段名 3.5查询数据 1.时间盲注 时间盲注是指基于时间的盲注&#xff0c;也叫延时注入&#xff0c;根据页面的响应时间来判断是否存在注入。 2使用场景 页面没有回显位置&#xff08;…

Lumina-mGPT图像生成;清华大学研发的首个开源预训练文本生成视频模型;Medical SAM 2实现2D和3D医学图像分割

✨ 1: Lumina-mGPT Lumina-mGPT是一种多模态自回归模型&#xff0c;尤其擅长将文本描述生成灵活逼真的图像。 Lumina-mGPT是一系列多模态自回归模型&#xff0c;能够处理多种视觉和语言任务&#xff0c;其中尤为擅长从文本描述中生成灵活的真实感图像。该模型家族由Alpha-VLL…