读书笔记//《数据分析:企业的贤内助》

news2025/5/26 7:50:53

数据分析师是个杂家——作者陈哲。

为什么写这本书?
懂得再多知识却不会用,原因是缺少通往思路、方法和技能的两条路径——项目流程和项目应用(案例)
——————————

数据分析师的晋升空间 (见第2章)

高级数据分析师的能力与表现(区别于助理数据分析师、数据分析师):
1)问题识别:独立识别并推动解决问题
2)方案设计:独立设计优秀的方案
3)分析方法:探索与验证分析(建模)
4)展现演示:不只是调理清晰,要简洁生动
5)价值应用:擅长问(是什么?为什么?未来会怎么样?怎么办?)
6)执行管理:与其他部门合作,领导跨部门项目,寻求资源
7)业内影响:常在媒体会议上发表观点看法,业内具有一定知名度

如何成为优秀的分析师?(见第3章)——很有参考价值!

1.修四重提升境界——qx如何评价一份分析报告?

(1)深度
深度是指数据分析对企业的决策支持程度。要全面回答3个问题:

  • 现状和问题是什么?
  • 问题为什么会发生? ——qx这一步很难,但是要尝试去做,做好
  • 该怎么办?——qx这一步很难,但是要尝试去做,做好

(2)效度
效度是指分析方法的效率。衡量标准有两个:速度和成本。速度快,成本低,效率就高。
例子:通过社交网络分析提前16天对流感提出预警。

(3)信度
信度是指分析结果的可靠程度。需满足三个条件:

  • 对比要可比
    -反例如:海军死亡率与居民死亡率不可比。分母结构不同,不具有统计可比性。
  • 差异要显著
    -反例如:不同收入用户群的满意度比较。统计平均数存在差异,但需要结合方差分析(如果只有2组类别用T检验),方差分析将进一步告诉我们平均数的差异来自“组间差异”还是“组内差异”。
  • 描述要全面
    -反例如:工资。统计的平均工资比去年有提高,但与大多数人感受不符。平均值衡量集中度,平均工资掩盖工作工资分配结构的问题。基尼系数可衡量差异度。

总结来说:
描述数据,既要有集中度、也要有差异度。差异度还要显著。
对比数据,一般是比率/比重,要注意分母口径是否统一。

(4)通度
通度即沟通的顺畅度。写报告三原则:

  • 能用图表就不用数据
    -重点突出,栩栩如生,让人迅速抓住关键信息。
  • 能用图片就不用文字
    -图片可增加更多元素,容易让人记住,产生视觉冲击,使人产生移情和共鸣。
  • 能用动态呈现就不用静态展示
    -尤其在表达随时间变化而变化的事物时。

qx(实际工作中,时间大量花在数据处理分析上,在最后呈现部分,往往不够重视)

2.悟四种专业态度——qx如何评价数据分析师的soft-skill?

(1)避免从众心理
存在意见领袖+人的懒惰心理或专家名人的光环效应,从而产生从众心理。破解之道是德尔菲法(专家意见法),核心要点是匿名原则或背靠背原则。
对数据分析师来说,从众心理导致放弃思考和坚持,从而不能理性决策,影响分析结果的有效性。

(2)避免偏见
在数据分析中不乏偏见和思维定势。需要系统分析、谨慎决策。

(3)合理怀疑(批判性思维)
在做数据分析时,要合理怀疑,通过假设检验等方法,核实自己的分析结论有多大的可信度。

(4)换位思考
外部数据和内部数据,相互印证、搭配使用。
第三方检测数据,具有全局性的优点,也有因抽样带来总体代表性问题的缺点。

3.熟五大分析要素——qx数据分析项目流程是什么?

qx(从这里开始以及后续章节内容是作者在咨询行业的经验之谈,不具有普遍参考价值)

(1)图纸——即输出项目方案或项目计划书
方法论工具:5W2H
(2)材料
调研数据及材料当然越多越好,但要考虑数据准确度与项目经费的平衡。
(3)步骤
数据分析六部曲:明确分析思路——数据采集——数据处理——数据分析——图表展现——报告撰写。
(4)工具——hard skill
(5)方法
按照所解决的问题,数据分析方法有四大类:描述、因果、预测、咨询。
按照所应用的领域,数据分析方法有三大类:量化战略、量化投资、量化经营。

数据分析师需要具备5项素质 (见第2章)

1.逻辑要清晰
将通过“合理的假设+系统的结构+严密的推理”,对零散信息进行分析。
2.坚持不懈
问题症结在哪里?不断经历“假设——探索——否定——假设”的循环过程。
3.细致入微
在细微之处不能掉以轻心。要对异常值敏感。
4.态度严谨
数据来源、统计口径、分析方法等都会影响分析结构的价值。
5.沟通顺畅

数据分析师的能力测试 (见第2章)
数据敏感性测试
逻辑思维能力测试

其他笔记:

1.数据分析组织架构
在这里插入图片描述

  • qx在组织架构方面,kingdee的数据分析偏属于综合式架构;hytera的数据分析偏属于分散式架构。
  • 综合式架构的弊端:由于分析师和业务部门互相独立、不熟悉,会产生数据分析师对需求理解的偏差有、业务部门对分析报告理解的偏差。解决之道:规范的流程、详细的文档、合理的展现、顺畅的衔接。
  • 分散式架构的弊端:由于部门利益与全面分析的矛盾,造成对数据分析师和业务部门的尴尬,影响分析效率、公司层面的整体把控和系统决策。作者更倾向于综合式架构。
  • qx我认为各有利弊,选用何种组织架构往往于企业文化、所在行业、发展阶段等息息相关。

2.数据分析在3大领域的应用
在这里插入图片描述
3.数据分析的价值
在这里插入图片描述

4.市场规模估算的思路
在这里插入图片描述

参考《数据分析:企业的贤内助》,感谢原作者!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/334955.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NLP模型检查英语语法错误

当NLP模型产生了语法错误,怎么办?比如,He wants that you send him an email.没关系,现在可以像小时候的英语老师,改作文一样简单。只要装上一个专门纠正语法错误的库就可以,还是毫秒钟就可揪出来的那种。这…

【shell】awk、sed、sort是什么?怎么用?

目录 一、AWK 干什么用的? 使用起来有什么条件? 怎么使用? 二、sed 功能? sed怎样读取数据? 怎样调用sed ? 三、sort 功能是什么? 命令有哪些? 本文只讲解了一些简略的知…

“千年之恋”注册页面制作

“千年之恋”注册页面制作一、实验名称:二、实验日期:三、实验目的:四、实验内容:五、实验步骤:六、实验结果:七、源程序:八、心得体会:一、实验名称: “千年之恋”注册…

算法导论—SAT、NP、NPC、NP-Hard问题

算法导论—SAT、NP、NP-Hard、NPC问题SAT 问题基本定义问题复杂性P、NP、NP-Hard、NP-Complete(NPC)证明NP-Hard关系图NP问题的概念约化的定义NPC问题NP-Hard问题SAT 问题基本定义 SAT 问题 (Boolean satisfiability problem, 布尔可满足性问题,SAT): 给…

C++之完美转发、移动语义(forward、move函数)

完美转发1. 在函数模板中,可以将自己的参数“完美”地转发给其它函数。所谓完美,即不仅能准确地转发参数的值,还能保证被转发参数的左、右值属性不变。2. C11标准引入了右值引用和移动语义,所以,能否实现完美转发&…

「敏捷架构」敏捷架构:规模化敏捷开发的策略

与流行的看法相反,架构是敏捷软件开发工作的一个重要方面,就像传统的工作一样,并且是扩展敏捷方法以满足现代组织的现实需求的关键部分。但是,敏捷专家的架构方式与传统主义者的方式略有不同。本文讨论以下问题: 迈向敏…

Acer传奇Go电脑开机自动安装软件卡死怎么重装系统?

Acer传奇Go电脑开机自动安装软件卡死怎么重装系统?一些用户在网络上下载安装了一些恶意软件之后,导致电脑中了病毒。每次开机联网之后,有很多的软件就会自动开始下载,占满你的桌面,这个情况导致电脑直接卡死了&#xf…

前端知识点复盘

组件和jsx <body><div id"root"></div><script type"text/babel">const root ReactDOM.createRoot(document.getElementById("root"))class App extends React.Component {render() {return (<div> <h1>s…

MOTORTECH控制器维修燃气机点火模块MIC500

MOTORTECH发电机点火控制器模块维修注意事项: (1)由于主配电板经常发生振动,因此故障多发生在振动较强烈之处,所以要检查引起振动的原因并排除之,如躲开共振转速,增加防震垫片等。 (2)尘埃是造成接触不良的原因,对接线端子座及防尘罩等容易附着灰尘的场所要经常清扫。 1、看元…

2023级浙江大学MBA提面优秀资格最新经验分享

通过将近一年时间的奋斗&#xff0c;我的浙大MBA备考之路也算是告一段落了&#xff0c;在备考之初&#xff0c;我也在网络上看了很多“经验帖”&#xff0c;深知提前批面试对于浙大MBA录取来说这个有多重要&#xff0c;虽然我的笔试成绩还没有出来&#xff0c;但是在考完后估分…

HTTP请求返回304状态码以及研究nginx中的304

文章目录1. 引出问题2. 分析问题3. 解决问题4. 研究nginx中的3044.1 启动服务4.2 ETag说明4.3 响应头Cache-Control1. 引出问题 之前在调试接口时&#xff0c;代码总出现304问题&#xff0c;如下所示&#xff1a; 2. 分析问题 HTTP 304: Not Modified是什么意思&#xff1f; …

2022年新一代kaldi团队技术输出盘点

目录 1. 技术创新 1.1 Pruned RNN-T loss 1.2 RNN-T 的快速 GPU 解码 1.3 多码本量化索引的知识蒸馏 1.4 RNN-T 和 CTC 的低延时训练 1.5 Zipformer 1.6 Small tricks 2. 模型部署 2.1 Sherpa 2.1 Sherpa-ncnn 3. 更多的 recipe 和模型 参考资料 1. 技术创新 1.1 …

C语言程序环境剖析——探究从.c到.exe之路

程序环境1.程序的翻译环境和执行环境2. 详解编译 链接2.1 翻译环境2.2 编译的三部分预编译编译汇编2.3链接3.运行环境1.程序的翻译环境和执行环境 在ANSI C的任何一种实现中&#xff0c;都存在两个不同的环境。 翻译环境&#xff0c;在这个环境中源代码被转换成可执行的机器指…

three.js 基础认识与简单应用

一、前言 1. 什么是three.js&#xff1f;你将它理解成threejs&#xff0c;three表示3D的意思&#xff0c;js表示JavaScript的意思&#xff0c;合起来&#xff0c;three.js就是使用JavaScript来写3D程序的意思。three.js是基于WebGL的一个运行在浏览器上的开源框架&#xff0c;使…

企业级安全软件装机量可能大增

声明 本文是学习大中型政企机构网络安全建设发展趋势研究报告. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 研究背景 大中型政企机构是网络安全保护的重中之重&#xff0c;也是国内网络安全建设投入最大&#xff0c;应用新技术、新产品最多的机构…

云原生系列之使用 prometheus监控MySQL实战

文章目录前言一. 实验环境二. 安装MySQL5.72.1 配置yum源2.2 安装MySQL之前的环境检查2.3 开始使用yum安装2.4 启动MySQL并测试三. 安装MySQL_exporter3.1 MySQL_exporter的介绍3.2 mysql_exporter的安装3.3 设置MySQL账户&#xff0c;用于数据收集3.4 启动mysql_exporter3.5 配…

2023年信息系统项目管理师,需要哪些备考资料?

其实考前心态是相当重要的&#xff0c;你需要战胜的一直是你自己。你首先要明确自己考试必胜的决心&#xff0c;树立好的备考心态&#xff0c;学习只要用对了方法&#xff0c;考试通过的几率还是挺高的。备考心得&#xff1a;我自己备考了3个月的时间通过了&#xff0c;分享一套…

Linux多线程---生产者消费者模型和线程池

目录 生产者消费者模型 条件变量 接口 实现基于阻塞队列的cp模型 POSIX信号量 信号量的PV操作 接口&#xff1a; 初始化信号量&#xff1a; 销毁信号量 等待信号量 发布信号量 基于环形队列的生产者消费者模型 线程池 应用场景&#xff1a; 如何实现&#xff1f; …

DHCP中继及配置

为什么需要DHCP Relay&#xff1f;产生背景解决方案DHCP Relay工作原理DHCP Relay配置实现产生背景 随着网络规模的扩大&#xff0c;网络中就会出现用户处于不同网段的情况。 这个时候客户A和客户B要请求IP地址时&#xff0c;首先会发送DHCP Discover广播包&#xff0c;这个广…

一本关于ChatGPT的书《ChatGPT 革命:了解大型语言模型的力量》免费下载

下载地址&#xff1a;https://download.csdn.net/download/winniezhang/87431530 这本书有什么不同&#xff1a; 1、从书名&#xff0c;到大纲&#xff0c;到内容&#xff0c;基本都来自ChatGPT的自述&#xff0c;本人只是负责编辑。 2、整个成书过程只用了2小时不到。 3、…