Python Day42 学习(日志Day9复习)

news2025/6/7 3:39:40

补充:关于“箱线图”的阅读

以下图为例 @浙大疏锦行

箱线图的基本组成

  • 箱体(Box):中间的矩形,表示数据的中间50%(从下四分位数Q1到上四分位数Q3)
  • 中位线(Median):箱体中间的横线,表示数据的中位数(50%分位)。
  • “胡须”(Whiskers):箱体上下延伸的线,通常表示1.5倍四分位距(IQR)以内的数据范围。
  • 离群点(Outliers):超出“胡须”范围的点,用小圆圈表示,代表极端值。

如何读这张图

  • 横轴(x轴)Credit Default,有两个类别(0和1),分别代表“未违约”和“违约”。
  • 纵轴(y轴)Annual Income,表示年收入。

每个类别下都有一个箱线图,分别展示该类别下年收入的分布情况。


具体解读:

  • 箱体高度:箱体越高,说明该类别下年收入的中间50%分布越分散;越矮则越集中。
  • 中位线位置:箱体中间的线,表示该类别下年收入的中位数。可以比较两组的中位数高低。
  • 上下“胡须”长度:反映数据的整体分布范围。
  • 离群点:箱体外的小圆点,表示极高或极低的年收入,是异常值。

结合该图:

  • 未违约(0)和违约(1) 两组都存在较多的离群点,说明都有极高的年收入个案。
  • 箱体位置和中位线:可以比较两组的年收入中位数和分布范围,看是否有显著差异。
  • 箱体宽度无实际意义,只是为了区分类别。

Q. 关于“箱体”和“箱体高度”

  • 箱线图中间的矩形部分叫“箱体”(Box)。
  • 这个箱体的下边界是下四分位数(Q1),上边界是上四分位数(Q3)
  • Q1 是数据中25%位置的数,Q3 是75%位置的数。
  • 所以,箱体表示的是从25%到75%之间的数据,也就是中间50%的数据分布范围

箱体高度

  • 箱线图的“箱体”表示的是该类别下年收入的中间50%(也就是从下四分位数Q1到上四分位数Q3之间的数据)。
  • 箱体高度就是箱体在y轴(年收入)方向的长度,反映了这50%数据的分布范围有多大。

详细解释:

  • 如果箱体很高,说明这50%的人的年收入差异很大,有的人收入高,有的人收入低,数据分布比较分散。
  • 如果箱体很矮,说明这50%的人的年收入都集中在一个较小的区间里,大家的收入水平比较接近,数据分布比较集中。

举例:

  • 比如“Credit Default=0”时箱体高度大于“Credit Default=1”,就说明未违约人群的年收入差异比违约人群大。

总结: 箱体越高,数据越分散;箱体越矮,数据越集中。箱体高度可以帮助你判断该类别下数据的离散程度。

补充:关于“小提琴图”的阅读

以下图为例

小提琴图的组成

  • 外形(轮廓):每个“Credit Default”类别下都有一个对称的“提琴”形状,表示该类别下“Annual Income”年收入的分布密度。外形越宽,说明该收入区间的人数越多。
  • 中间的白色点/线:通常表示中位数和四分位数(有的版本会显示箱线图的元素)。
  • 宽度:反映数据在该区间的密集程度,越宽说明数据越集中,越窄说明数据越稀疏。

 如何读这张图

  • 横轴(x轴)Credit Default,有两个类别(0=未违约,1=违约)。
  • 纵轴(y轴)Annual Income,表示年收入。
  • 每个小提琴:展示该类别下年收入的分布情况。

具体解读:

  • 形状宽窄
    • 某一高度(年收入区间)越宽,说明这个收入区间的人数越多。
    • 某一高度越窄,说明这个收入区间的人数越少。
  • 中间的白色线/点
    • 白色粗线是中位数,箱体表示四分位数范围(和箱线图类似)。
  • 对比两组
    • 可以比较违约和未违约两组的年收入分布是否有明显差异。
    • 例如,两组的分布形状、峰值位置、宽度等是否不同。

结论举例

  • 如果某一组的小提琴在高收入区间特别宽,说明该组高收入人群多。
  • 如果两组小提琴形状差不多,说明两组年收入分布相似。
  • 如果一组的中位数更高,说明该组整体收入更高。

手写笔记复习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2402420.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CMake在VS中使用远程调试

选中CMakeLists.txt, 右键-添加调试配置-选中"C\C远程windows调试" 之后将 aunch.vs.json文件改为如下所示: CMake在VS中使用远程调试时,Launch.vs.json中远程调试设置 ,远程电脑开启VS专用的RemoteDebugger {"version": "0.2.1","defaul…

《图解技术体系》How Redis Architecture Evolves?

Redis架构的演进经历了多个关键阶段,从最初的内存数据库发展为支持分布式、多模型和持久化的高性能系统。以下为具体演进路径: 单线程模型与基础数据结构 Redis最初采用单线程架构,利用高效的I/O多路复用(如epoll)处…

一文速通Python并行计算:12 Python多进程编程-进程池Pool

一文速通 Python 并行计算:12 Python 多进程编程-进程池 Pool 摘要: 在Python多进程编程中,Pool类用于创建进程池,可并行执行多个任务。通过map、apply等方法,将函数和参数分发到子进程,提高CPU利用率&…

Web前端之原生表格动态复杂合并行、Vue

MENU 效果公共数据纯原生StyleJavaScript vue原生table 效果 原生的JavaScript原生table null 公共数据 const list [{id: "a1",title: "第一列",list: [{id: "a11",parentId: "a1",title: "第二列",list: [{ id: "…

『uniapp』把接口的内容下载为txt本地保存 / 读取本地保存的txt文件内容(详细图文注释)

目录 预览效果思路分析downloadTxt 方法readTxt 方法 完整代码总结 欢迎关注 『uniapp』 专栏,持续更新中 欢迎关注 『uniapp』 专栏,持续更新中 预览效果 思路分析 downloadTxt 方法 该方法主要完成两个任务: 下载 txt 文件:通…

【Redis技术进阶之路】「原理分析系列开篇」分析客户端和服务端网络诵信交互实现(服务端执行命令请求的过程 - 时间事件处理部分)

揭秘高效存储模型与数据结构底层实现 【专栏简介】【技术大纲】【专栏目标】【目标人群】1. Redis爱好者与社区成员2. 后端开发和系统架构师3. 计算机专业的本科生及研究生 时间事件:serverCron函数更新服务器时间缓存更新LRU时钟-lruclock更新服务器每秒执行命令次…

【DAY40】训练和测试的规范写法

内容来自浙大疏锦行python打卡训练营 浙大疏锦行 知识点: 彩色和灰度图片测试和训练的规范写法:封装在函数中展平操作:除第一个维度batchsize外全部展平dropout操作:训练阶段随机丢弃神经元,测试阶段eval模式关闭drop…

el-select 实现分页加载,切换也数滚回到顶部,自定义高度

el-select 实现分页加载&#xff0c;切换也数滚回到顶部&#xff0c;自定义高度 1.html <el-form-item label"俱乐部&#xff1a;" prop"club_id" label-width"120px"><el-select :disabled"Boolean(match_id)" style"w…

Langchaine4j 流式输出 (6)

Langchaine4j 流式输出 大模型的流式输出是指大模型在生成文本或其他类型的数据时&#xff0c;不是等到整个生成过程完成后再一次性 返回所有内容&#xff0c;而是生成一部分就立即发送一部分给用户或下游系统&#xff0c;以逐步、逐块的方式返回结果。 这样&#xff0c;用户…

学习经验分享【40】目标检测热力图制作

目标检测热力图在学术论文&#xff08;尤其是计算机视觉、深度学习领域&#xff09;中是重要的可视化分析工具和论证辅助手段&#xff0c;可以给论文加分不少。主要作用一是增强论文的可解释性与说服力&#xff1a;论文中常需解释模型 “如何” 或 “为何” 检测到目标&#xf…

C#里与嵌入式系统W5500网络通讯(3)

有与W5500通讯时,需要使用下面的寄存器: PHYCFGR (W5500 PHY Configuration Register) [R/W] [0x002E] [0b10111XXX] PHYCFGR configures PHY operation mode and resets PHY. In addition, PHYCFGR indicates the status of PHY such as duplex, Speed, Link. 这张表格详细…

用OpenNI2获取奥比中光Astra Pro输出的深度图(win,linux arm64 x64平台)

搞了一个奥比中光Astra Pro&#xff0c;想在windows平台&#xff0c;和linux rk3588 &#xff08;香橙派&#xff0c;ubuntu2404,debian)上获取深度信息&#xff0c;之前的驱动下载已经不好用了,参考如下 Astra 3D相机选型建议 - 知乎https://zhuanlan.zhihu.com/p/594485674 …

Unity VR/MR开发-VR设备与适用场景分析

视频讲解链接&#xff1a;【XR马斯维】VR/MR设备与适用场景分析&#xff1f;【UnityVR/MR开发教程--入门】_游戏热门视频

Linux: network: switch:arp cache更新规则 [chatGPT]

文章目录 介绍概念普通包带有不同的mac,是否更新arp cache?普通包带有相同的mac,是否刷新 aging timeswitch是否会主动学习介绍 关于arp cache在switch侧的行为。有很多问题需要理解。 概念 HP L3 - IP Services Configuration Guide 文档里有写:dynamic arp entry的解说…

Java网络编程API 1

Java中的网络编程API一共有两套&#xff1a;一套是UDP协议使用的API&#xff1b;另一套是TCP协议使用的API。这篇文章我们先来介绍UDP版本的API&#xff0c;并尝试来写一个回显服务器&#xff08;接收到的请求是什么&#xff0c;返回的响应就是什么&#xff09;。 UDP数据报套…

兰亭妙微 | 医疗软件的界面设计能有多专业?

从医疗影像系统到手术机器人控制界面&#xff0c;从便携式病原体检测设备到多平台协同操作系统&#xff0c;兰亭妙微为众多医疗设备研发企业&#xff0c;打造了兼具专业性与可用性的交互界面方案。 我们不仅做设计&#xff0c;更深入理解医疗场景的实际需求&#xff1a; 对精…

前端原生构建交互式进度步骤组件(Progress Steps)

在现代网页设计中&#xff0c;进度步骤&#xff08;Progress Steps&#xff09; 是一种常见的 UI 模式&#xff0c;常用于引导用户完成注册流程、多步表单、教程或任何需要分步骤操作的场景。本文将带你从零开始构建一个美观且功能完整的 “进度步骤”组件&#xff0c;并详细讲…

【基于阿里云搭建数据仓库(离线)】Data Studio创建资源与函数

Data Studio支持在您的数据分析代码中引用自定义的资源和函数&#xff08;支持MaxCompute、EMR、CDH、Flink&#xff09;&#xff0c;您需要先创建或上传资源、函数至目标工作空间&#xff0c;上传后才可在该工作空间的任务中使用。您可参考本文了解如何使用DataWorks可视化方式…

web3-以太坊智能合约基础(理解智能合约Solidity)

以太坊智能合约基础&#xff08;理解智能合约/Solidity&#xff09; 无需编程经验&#xff0c;也可以帮助你了解Solidity独特的部分&#xff1b;如果本身就有相应的编程经验如java&#xff0c;python等那么学起来也会非常的轻松 一、Solidity和EVM字节码 实际上以太坊链上储存…

【C++项目】负载均衡在线OJ系统-2

文章目录 oj_server模块编写oj_server框架的搭建-oj_server/oj_server.cpp 路由框架 oj_model模块编写题目信息设置v1.文件版本-common/util.hpp boost库spilt函数的使用-oj_server/oj_model_file.hpp 文件版本model编写v2.mysql数据库版本1.mysql创建授权用户、建库建表录入操…