数据治理的数字画像

news2025/6/22 19:32:33

5fcba2b4615c62ca7db6478cf9f563ec.jpeg

随着全网步入大数据时代,企业的目光日益聚焦在利用大数据服务精细化营销、精细化运营上,各类客户画像、员工画像理论如雨后春笋般兴起,而数据应用的底层——数据治理,却鲜有整体的理论体系。如何避免治理工作自身“无的放矢”,如何量化数据基础建设的贡献,我们需要为数据治理工作描绘一张“数字画像”。这个命题的内涵外延非常丰富,在此我们选取用户体验、架构质量两个角度进行讨论。

加gzh”大数据食铁兽“,了解更多数据治理咨询

54e6235839ccc3e52a7b5dc19a4245f5.jpeg

一用户体验的数字画像

基于不同的感知角度,将用户分为外部客户、内部用户、管理层、技术人员四类,针对特定的业务场景刻画四类使用者所体会到的“科技赋能”。

de03fefd184f6033b24c2174074641cc.jpeg

1、外部客户

功能体验指标:功能体验指标用于衡量操作平台的易用性及直观程度。可以通过各类埋点,对用户的点击行为、页面停留时间、页面浏览深度进行跟踪。从而挖掘用户常使用的功能,探究用户的实际需要,对于常用功能可以开展功能的改版优化,进行同业产品比较、用户反馈调查等,重点关注主要功能的流畅度、实用性。

平台服务指标:

(1)服务平台一般利用API接口向外提供数据,因此,通过计算API调用率可以计算出其向外输出服务的活跃程度。

(2)由数据服务带来的产品升值也是需要衡量的一大重要指标。营销、运营等商业活动价值提升以一定的比例分配给其相应的数据治理工作,从业务部门有感的角度评估数据治理工作对营销等活动的赋能。

2、内部用户

便利性:过去业务部门向数据管理部门申请使用数据,通常使用邮件或行政流程的方式,这种方法无法实时跟踪申请进度,也无法在统一的页面集中管理,导致相关工作人员在查询与沟通上花费了大量精力。建立自动化、规范化流程以及线上运营工具,将极大地便利流程,因此,手工提取工单压降比率可以作为度量内部用户程度的指标。

时效性:线上化数据治理意味着资产地图、标准架构即存放在用户指尖,关键作业的全链路交付时间是触达内部用户的另一直观感受。该指标可以通过统计各节点的流转时间,计算相应平均值获得。

贡献度:不仅是底层的数据管理,数据的应用输出同样能够为用户带来实际业务价值。BI工具的使用、模型提供数量等指标标志着用户对于应用类数据成果的满意度。

3、管理层

质量提升:对于管理层而言,保障数据仓库、数据湖的“清澈”是他们关心的问题。由于监管报送结果是银保监对银行的重点考核指标,报送规定的数据质量达标率成为对于管理层数据治理成效最直观的反映。基于DQC的一系列指标同样可作为面向管理层的数据清洁度体现。

效率提升:除监管要求之外,数据运营成本对于全行管理也是至关重要的。只有建立规范和高效的数据架构,压降数据报表,降低储存、运维成本,才能实现精细化营运,维持高效率盈利。

4、技术人员

数据字典评分:当企业实施开发过程强管控时,数据字典的角色可看作是法律之于社会,其整体逻辑必须经得起反复推敲。在数据字典的查询页面设立评分反馈是一种简单但行之有效的方法。页面上有计划的引导,反映设计者关注开发人员的使用体验,从而让“吐槽”变成建议,优化和解决使用数据字典时遇到的问题。

二架构质量的数字画像

全行统一的数据架构应在追求高效率的同时降低成本,根据《华为数据之道》中信息架构的经典四范式,我们将从模型、分布、标准、资产四个角度对架构赋能能力进行度量。

0a76d63704c6cc68406bb0a44381463c.jpeg

1、模型

公共层加工频率:公共层中存放有事实数据、维表数据等等,它们支撑着指标体系中的一级指标层。在建立指标时,将维度规范化、集约化,提高公共指标的复用性,减少重复加工的操作,故公共层数据模型的复用率可作为公共层架构评估的指数之一。

应用层引用频率:类似于人际关系网络拓扑结构中的核心人物算法,该指数直接衡量应用层中数据的系统性重要程度,引导资产盘点的目标。数据血缘关系是一种有向的、无权值、无自环的网络图。被引用频率高的资产一般来源于关键业务实体中最准确和最及时的业务记录。这一些资产被跨部门、跨业务领域调用的概率最大,需要实现所有部门可访问并且访问到相同的数据。该指数还能够有效地筛选出“孤儿表”、临时表,减少资源投入和储存成本。

0c755160e5f6153bfbd8e4d77ad46ade.jpeg

2、分布

数据覆盖:对于大型银行而言,数以百计的系统,数以万计的库表在全国范围内分布式储存。采集是资产盘点的第一步,测量采集数在全量系统的覆盖率帮助我们明确当前采集的进度,定位未采集的数据来源。

数据冗余:数据冗余指同层数据的冗余,具体可分为两个来源。第一,多个物理位置中存储了相同意义的数据;第二,架构模型本身在设计上有较多的重复交叉项。

数据容量:数据容量是对数据中台的整体描述,它包括当前中台所囊括的整体数据体量的绝对值,也包含该体量随时间的增长比例。数据容量并非越高或者越低更理想,它需要结合银行的现状辩证性地看待。

3、标准

标准稳定性:数据标准规范化了数据含义、结构等等,应当满足内容统一、不交叉定义等条件,避免数据标准内部发生“数据打架”。

标准落标率:在标准的技术规范完备,主题齐全,标准已权威发布的前提下,标准落标率反映了数据标准“最后一公里”的执行情况。借助自动化工具,能够计算出各类分层、切片后的数据落标率,智能化地发现落标潜在问题。

4、资产

技术元数据统计:技术元数据打通了源数据和数据仓库,记录了数据从产生到消亡的过程。我们从中挑选出系统覆盖率、系统内表级覆盖率、表名以及字段名的有效率、枚举值的有效率等统计指标表示数据架构中技术类资产的产出效益。

企业活动命中率:数据资产是从业务流程、业务模型中抽取出来的数字化描述。标签资产对业务行为的命中率、指标资产对报表统计的命中率、报表资产的用户访问量等数值越高,代表着资产内容映射企业活动的准确度越高。

结束语

伴随着企业数字化转型不断深入,“数据治理的数字画像”从方法论到实践都将趋于完善,内容价值、安全性能、用户体验也会随之提高。如何动态地衡量数据治理工作成效,建立适合自身企业的“北极星指标”,是每一家处于智慧转型阶段的公司所必须研究的,它的成功将创造出不可估量的商业价值。

源:知乎

免责声明:以上报告均系本平台通过公开、合法渠道获得,报告版权归原撰写/发布机构所有,如涉侵权,请联系删除 ;资料为推荐阅读,仅供参考学习,如对内容存疑,请与原撰写/发布机构联系

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1086426.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

泛微E8 查询分部总部部门信息

当查询泛微 OA 部门,请使用 HrmDepartment 表;当查询分部信息,请使用 HrmSubCompany 表。当查询总部信息,请使用 HrmCompany 表。 其中,总部信息通过总部 id - 分部 companyid 进行关联;分部信息通过分部 …

在这个砸钱推广都效果甚微的时代,你该如何突出重围

有市场就有竞争,有竞争就有优胜劣汰,不做引领就会被遗忘,近几年,“数字化”、“智能化”一直是业内热议的话题,数据驱动的营销模式是未来市场显著的特征,运营商大数据在营销领域能帮助企业提升销售效率,降低企业获客成…

URL because the SSL module is not available

Could not fetch URL https://pypi.org/simple/pip/: There was a problem confirming the ssl certificate: HTTPSConnectionPool(host‘pypi.org’, port443): Max retries exceeded with url: /simple/pip/ (Caused by SSLError(“Can’t connect to HTT PS URL because the…

软件TFN 2K的分布式拒绝攻击(DDos)实战详解

写在前头 本人写这篇博客的目的,并不是我想成为黑客或者鼓励大家做损坏任何人安全和利益的事情。因科研需要,我学习软件TFN 2K的分布式拒绝攻击,只是分享自己的学习过程和经历,有助于大家更好的关注到网络安全及网络维护上。 需要…

微信小程序/vue3/uview-plus form兜底校验

效果图 代码 <template><u-form :model"form" ref"formRole" :rules"rules"><u-form-item prop"nickname"><u-input v-model"form.nickname" placeholder"姓名" border"none" /&…

美国隐私安全人工智能大模型公司【Fantix】160万美元融资

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 猛兽财经获悉&#xff0c;总部位于美国纽约的隐私安全人工智能大模型公司【Fantix】今日宣布已完成160万美元B轮融资。 本轮融资的投资者包括Gaingels&#xff0c;Notion Capital&#xff0c;Founders Factory&#xff0c;F…

scsi MODE SENSE(6)命令 和 MODE SENSE(10)命令总结

一&#xff1a;MODE SENSE(6)命令概述 MODE SENSE(6)命令(参见表73)为设备服务器向应用程序客户机报告参数提供了一种方法。它是MODE SELECT(6)命令的补充命令。执行MODE SENSE(6)命令的设备服务器也应执行MODE SELECT(6)命令。 命令格式 DBD (disable block descriptors) bi…

c++视觉处理-----Laplacian算 子

Laplacian算 子 cv::Laplacian 是 OpenCV 中的一个函数&#xff0c;用于应用Laplacian算子&#xff08;拉普拉斯算子&#xff09;在图像上进行边缘检测。以下是 cv::Laplacian 函数的基本用法&#xff1a; cv::Laplacian(src, dst, ddepth, ksize, scale, delta, borderType)…

sql分组去重计数distinctcountgroup by

count 可以与 distinct 连用&#xff0c;这样可以实现去重计数&#xff1b;加上group by 可实现按某个字段分组&#xff0c;而对其它字段进行去重计数 学习链接 count()和distinct关键字的使用 distinct关键字 distinct关键字是用于去除重复的数据记录。distinct使用情况&a…

09_Webpack打包工具

1 初识Webpack 1.1 什么是Webpack Webpack打包工具对项目中的复杂文件进行打包处理&#xff0c;可以实现项目的自动化构建&#xff0c;并且给前端开发人员带来了极大的便利。 目前&#xff0c;企业中的绝大多数前端项目是基于Webpack打包工具来进行开发的。 1.2 Webpack的安…

ChatGPT,AIGC 数据库应用 Mysql 常见优化30例

使用ChatGPT,AIGC总结出Mysql的常见优化30例。 1. 建立合适的索引:在Mysql中,索引是重要的优化手段,可以提高查询效率。确保表的索引充分利用,可以减少查询所需的时间。如:create index idx_name on table_name(column_name); 2. 避免使用select * :尽可能指定要返回的…

拼多多商品品牌数据采集接口,拼多多商品详情数据接口,拼多多API接口

拼多多商品品牌数据采集的方法如下&#xff1a; 手动数据采集。直接在拼多多平台上搜索并手动复制商品数据&#xff0c;适合采集小批量的商品数据。自动数据采集。通过爬虫来自动获取&#xff0c;具体步骤如下&#xff1a; 选择爬虫框架并安装。Python爬虫框架有很多&#xf…

计算机毕业设计选什么题目好?springboot 校园失物招领平台

✍✍计算机编程指导师 ⭐⭐个人介绍&#xff1a;自己非常喜欢研究技术问题&#xff01;专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目&#xff1a;有源码或者技术上的问题欢迎在评论区一起讨论交流&#xff01; ⚡⚡ Java实战 |…

发布npm包质量分测试

查询质量分接口 https://registry.npmjs.org/-/v1/search?textcanvas-plus v0.0.1 quality 0.2987 新建文件夹 canvas-plus 执行命令 npm init 生成package.json {"name": "3r/canvas-plus","version": "0.0.1","descript…

EXCEL——根据单元格值设置不同色阶

方法&#xff1a;开始—>条件格式—>色阶&#xff08;默认色阶或复杂色阶&#xff09;。 一、默认色阶 如图&#xff0c;可选择自定义的色阶模式。 二、复杂色阶 1、如图&#xff0c;点击"其他规则" 2、选择复杂格式 此时可以看到&#xff0c;支持多种格式…

uniapp 使用和引入 thorui

1. npm install thorui-uni 2. "easycom": { "autoscan": true, "custom": { "tui-(.*)": "thorui-uni/lib/thorui/tui-$1/tui-$1.vue" } }, 3.

spring boot RabbitMq基础教程

RabbitMq 由于RabbitMQ采用了AMQP协议&#xff0c;因此它具备跨语言的特性。任何语言只要遵循AMQP协议收发消息&#xff0c;都可以与RabbitMQ交互。并且RabbitMQ官方也提供了各种不同语言的客户端。 但是&#xff0c;RabbitMQ官方提供的Java客户端编码相对复杂&#xff0c;一般…

如何看待国内PMP考试通过率高达97%?

自认为是虚高&#xff0c;虽然中国人在考试方面的确独树一帜的强&#xff0c;应该也没有这样夸张。 我分析&#xff0c;因为报考的条件有一个“由PMI项目管理协会授权的培训机构开具35学时证明”&#xff0c;这样&#xff0c;就都不得不去报培训班&#xff0c;但大家都知道有可…

Qual+Android方案Unlock学习 以Oneplus7Pro为例

目录 背景 Unpack guacamole_21_H.04_190416.ops Unlock探究 开发者选项–允许解锁 fastboot oem unlock extract LinuxLoader from abl 过程分析 FH读写分区 逆向MSM Download USB抓包 token & pk 逆向结果 尝试修改分区实现unlock VerifiedBoot Protocol 分…

Spring-事务源码解析2

上一篇文章我们介绍了事务开启注解EnableTransactionManagement源码解析《Spring-事务源码解析1》 里面提到了2个关键组件&#xff0c;这里我们分析下Spring如何利用这2个组件来给Bean创建代理对象。 文章待整理 先说下执行流程&#xff0c;当请求进来的时候&#xff0c;会执…