关于数据治理工具的选型,你了解多少?

news2025/7/18 20:48:38

数据治理的本质是盘点数据资产、治理数据质量,实施数据全生命周期的管理,这里面包括了建组织、立制度或者使用一款数据治理的软件帮助企业开展数据治理的相关工作等等。根据不同的数据治理项目特点,会用到不同的技术或工具。拥有一套趁手好用的平台和工具,无疑能够让您的数据治理工作事半功倍。

对于数据治理工具的选型,通常大家会关心以下问题,例如:

  • 企业通常利用本地部署还是基于云的工具?

  • 目前是否有中心化的数据平台?是否需要一个能与多个数据平台集成的工具?大概范围是什么样?

  • 是否需要一个工具来处理来自多个数据源的大量数据?

  • 用户是否需要自助式的数据服务满足工作流程中的数据需求?

数据治理工具全景图(来源:大数据标准工作组)

那么整体对于企业来讲,如何来选择一款数据治理的软件能更大程度的保障管理效果,促进管理目标达成,结合十多年的从业经历,给大家提供以下两个维度作为参考,既关注工具本身,也要考虑企业自身实力

工具的能力

数据治理工具选型的首要因素是工具自身,具体可以从功能、性能、架构、采购成本四个方面进行考虑。

1、产品功能

对于数据治理工具功能的考察要结合企业自身的业务需求,要选择最适合企业现状和发展要求的。在数据治理领域,目前有两个学术流派,一是全面的数据治理体系,二是面向主题的数据治理,这两套体系没有谁高谁低,针对不同的企业选择适合的策略和适合的工具。

假如您的企业中没有或技术人员不足,那么选择的数据治理工具的功能一定要简单易用并且功能点要覆盖企业的业务需求,尽量减少定制化开发的功能。假如您的企业技术实力雄厚,可以选择一个稳定的框架,部分功能可以定制开发,这样也许更加易用和适用。

在功能指标上,不同的数据治理主题关注的功能和工具不同,例如:元数据管理、数据质量管理、数据标准管理、主数据管理等。从技术选型角度来看,数据治理工具落地需要考虑的功能列表有:

  • 跨平台支持各主流数据库和数据平台的元数据信息

  • 管理关键数据资产,如数据字典

  • 跟踪和管理元数据操作历史和变更记录

  • 批量导入和更新元数据

  • 分配数据治理流程角色和策略

  • 定义工作流程和管理用户权限

  • 通过数据探查快速分析业务数据情况

  • 自动化追踪数据质量指标和效果

  • ……

这个话题会涉及很多技术细节,这里就不再一一展开了。但是,要重点强调的是数据治理工具的选型一定要了解其工作方式及其自动化程度,以及完成特定任务可能需要的特定功能。最后,至关重要的是要考虑数据控制、安全性和许可等因素。

此外,评估和选择数据治理工具不仅取决于功能,还取决于您如何使用这些工具来增加业务价值。例如,如果您对元数据管理有要求,请确保在使用具有该功能的数据治理工具之前,应该搞清楚为什么要用元数据工具,它能帮助企业的业务价值带来些什么或改变什么?

2、产品性能

数字化时代,企业的数据环境变得多样而复杂,大数据的4V特征(体量大、多样化、速度快、密度低)已经展现的淋漓尽致。考虑到需要处理的大量数据以及业务需求的日益复杂,对于任何正在评估的新技术和工具,都必须考虑性能和可伸缩性。数据治理的工具需要能够支持大量并发用户和非常大的数据集,尤其是针对数据模型工具、数据质量工具、数据集成工具、数据存取工具。

3、产品架构

产品架构包括了数据架构、技术架构、应用架构、安全架构、部署架构等。在数据治理项目中,数据架构更多的是需要根据企业的现状和需求进行规划设计的,比如数据的分层分级、数据的存储、数据的读取、数据的安全控制等。

技术架构重点是考察供应商产品的技术先进性。当下微服务架构、人工治理、区块链、大数据、云计算等都是流行的技术,如果您考察的产品用的技术架构比较老旧,则与主流架构生态的融合则会存在一定的障碍。

应用架构是从功能组件的适用性、易用性,以及功能组件的关联性等方面进行考量的。

安全架构是考察产品在数据安全防护和个人隐私数据保护层面的功能和成熟度。

此外,在部署模式上是否支持云部署也是一个需要考虑的点,因为很多中小企业不得不考虑成本问题,机房、服务器和人力资源都是需要投入资金的。

4、采购成本

数据治理工具选型通常会受到财务预算的限制,因而采购成本也是不少企业在选型时重点考虑的因素。然而,对采购成本的控制不等于简单的报价和还价,价低者为最佳,还应该包含对很多隐性因素的考量,比如购买成本、实施成本、升级成本、学习成本等。

现实中大多数企业都只关注购置成本,并试图将其最小化,而不是以总拥有成本为标准。正如前两年的云计算项目,出现了很多“0元中标”情况。事实上,这种看似购置价为“0”的项目,每年都需要需要投入大量服务费、运营费,总的成本并不低。要相信:“羊毛出在羊身上”。

厂商的能力

除了前面列出的工具相关要素外,数据治理厂商的整体实力也是选型时需要考虑的重要方面。企业的数据治理是一项持续的长期工作,所以对于数据治理工具的选型要尽量选择能够长期合作的、靠谱的厂商。尤其是要当心一些概念炒作一流,拿不出“真货”的厂商,如果选择了这样的厂商,您的企业很有可能成为被拿来试验的”小白鼠”。

毕竟从某种意义上来说,数据治理厂商的能力决定着数据治理工具的优劣。在厂商层面,主要考虑解决方案、服务、品牌和市场4个要素。

1、解决方案

解决方案是数据治理厂商能力的一个重要表现,虽然不是直接反映产品和工具的功能,但是解决方案能力保证企业如何才能将工具使用起来的重要措施。这往往考察的是企业在数据治理方面上的实施经验或成熟的案例。数据治理解决方案能力主要包括但不限于:数据治理组织体系、数据治理流程体系、数据治理运维管理、数据治理考核体系等。

同时,是否拥有具体行业的解决方案反映出厂商对该行业的数据治理应用是否积累了丰富经验,对行业特点是否有较为透彻的了解。越来越多的企业期望将工具与企业具体业务做更好的结合,从而产出更大的价值。完备的行业解决方案能够帮助企业精准定位业务问题,对症下药,得到的效果自然也就更好。

2、服务

数据治理相关的项目都应该是更注重服务的,厂商在数据领域的咨询规划能力、专业业务和技术能力非常重要。其实,一旦数据治理产品在使用中出现问题,如果厂商无法提供服务,企业就需要再投入成本进行后期维护,这项工作极其困难而繁重。

比如厂商是否提供产品的配套文档或其他基于文本的材料,一般包括:产品手册、产品章程、产品规格说明、数字媒体、产品白皮书等;充分考虑厂商是否提供本地化服务,是否能快速响应,是否有完善的问题解决机制等,并且还要考虑对于企业一些特定的需求,厂商是否能提供服务支持对数据治理产品的二次开发。当然,如果您的企业技术和业务能力如果足够强大,不需要太多依赖供应商来的话,该环节可以忽略。

3、品牌

品牌是数据治理厂商整体实力、用户认可度和口碑的综合体现,无论买什么,选头部品牌总没错。在 B2B 领域,品牌就是厂商的形象。关于数据治理厂商品牌的评估,可以先看厂商的运营方式,比如是一站式服务还是组合式服务,再看厂商的经验和积累的口碑,比如是否有众多的成功案例,是否给企业客户带来了很大的价值。

4、市场占有率

市场就是最好的试金石,是工具和厂商两大要素的综合体现。激烈的市场竞争会自动淘汰掉产品能力差、生命周期短的数据治理工具,因此数据治理工具的市场占有率、行业地位、领先程度在很大程度上说明了其优越性,是 IT 进行选型的首要考虑标准。

以上是数据治理工具选型时,需要特别注意的几个方向 ,大家在选型的时候可以参考。很显然在数字化时代,借助类似于睿治数据治理平台的这些工具,可以加速企业数字化转型进程。受市场认可的软件其实有很多,选择时必须要结合实际的情况。一般的情况下,都建议选择市面上较主流的产品,比较容易达到好的效果,目前企业数据治理软件市场占有率前列的,就是亿信华辰的睿治数据治理平台,官网可以在线试用,大家对功能可以有个很全面的评估。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/36185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

功率放大器的三种类型是什么意思

很多人都知道功率放大器,但是却不知道同样都是功率放大器,但是名字相同,作用却是完全不同的,总是会有工程师发出这样的疑问“功率放大器的三种类型是什么以及功率放大器怎么选择型号”等等,今天就请安泰电子来为我们解…

SpringBoot整合Alibaba-Dubbo和Apache-Dubbo

文章目录1 Alibaba整合Dubbo1.1 服务提供者1.1.1 服务提供者接口1.1.2 服务提供者实现类1.1.2.1 项目结构图1.1.2.2 pom.xml1.1.2.3 服务实现类1.1.2.4 配置文件1.1.2.5 启动类1.2 服务消费者1.2.1 项目结构图示1.2.2 请求入口1.2.3 配置文件1.2.4 启动类2 Apache整合Dubbo2.1 …

Pytorch学习笔记(四)官方60min入门教程之图像分类器

你已经了解了如何定义神经网络,计算损失值和网络里权重的更新。 现在你也许会想应该怎么处理数据? 通常来说,当你处理图像,文本,语音或者视频数据时,你可以使用标准 python 包将数据加载成 numpy 数组格式…

Web3中文|10月份超48%的以太坊NFT交易额是假的

来源 | cryptoslate 编译 | BoweniNFTnews.com 10月份全球NFT销售额超过8.5亿美元,总交易量约为300万笔。 NFT月销售额 数据来源:Footprint Analytics 在市场状况不佳的情况下,仍有大量唯一买家与卖家。10月份有超过100 万的唯一买家和卖家…

第九章 哈希表 AcWing 1532. 找硬币

第九章 哈希表 AcWing 1532. 找硬币 原题链接 AcWing 1532. 找硬币 算法标签 哈希表 双指针 思路 使用哈希表集合 用一个哈希表存储硬币。 对于每一枚硬币 x,判断在集合中是否存在 y,使得 x y m。 如果存在,则是一组解,判…

Linux Command htpasswd 创建密码文件

文章目录Linux Command htpasswd 创建密码文件1. 简介2. 安装3. 语法4. 选项5. 示例6. 其他Linux Command htpasswd 创建密码文件 1. 简介 htpasswd是Apache的Web服务器内置的工具,用于创建和更新储存用户名和用户基本认证的密码文件。 2. 安装 centos 7、 redhat&#xff…

MCE | 靶向 cGAS-STING 通路或可治疗渐冻症

自从 12 年前被发现以来,STING 途径就吸引了众多TOP生物学家的关注,去年 3 月,陈志坚教授带领的研究团队和其合作者在 Nature 上同日发表三篇论文,让 cGAS-STING 通路大火了一把,并被认为是未来十年内肿瘤免疫靶点的“…

指静脉当前遇到的问题

一、《基于改进残差网络的指静脉识别算法》_易芮 2020.5.20 ①采集到的指静脉图像质量不高"边缘曝光"及手指的自由度导致图像存在的偏移问题 (传统的指静脉识别技术是基于图像的纹理、特征点等细节进行特征提取,若图像质量较差的话&#xff…

thymeleaf抽取公共页面

thymeleaf抽取公共页面Thymeleaf中th:include、th:replace、th:insert、th:fragment用法及区别th:include、th:replace、th:insert区别在开发Web网站的时候,HTML页面有很多是相同的,如果每一个页面都写一遍,不仅非常麻烦,而且非常…

基于粒子群算法的城轨列车牵引多目标能耗优化问题附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

python基础之元组

文章目录一、元组注意:二、创建元组怎么验证这个变量真的是一个元组类型:三、使用迭代遍历元组四、应用场景五、格式化字符串后面的()本质上就是元组六、元组和列表之间的转换一、元组 元组(Tuple)与列表类…

Python(PyQt5)制作帮助文档查看器(可显示后缀名为md的文件)同时显示文本和图片

先看完整效果图: 帮助文档查看器是很多程序中必备要素,而利用Qt中的QTreeView组件可以很方便的查看文件,而QTextBrowser可以直接显示格式化的MarkDown文本。因此可以利用这两个组件制作一个帮助文件查看器。 未优化 效果图: 问题优化: 你会发现QT treeView列宽设置不成功问题…

Mybatis-Plus 06 条件构造器和常用接口

一、wapper介绍 Wrapper : 条件构造抽象类,最顶端父类 AbstractWrapper : 用于查询条件封装,生成 sql 的 where 条件 ​ QueryWrapper : 查询条件封装 ​ UpdateWrapper : Update 条件封装 AbstractL…

PG::Inclusiveness

nmap -Pn -p- -T4 --min-rate1000 192.168.134.14 nmap -Pn -p 21,22,80 -sCV 192.168.134.14 80端口是默认页面,先查看21端口FTP服务的匿名登录,并未发现可利用信息。 继续查看80端口,在robots.txt中得到提示。 https://www.howtogeek.co…

【Kubernetes | Pod 系列】Pod的 YAML 清单文件详解

目录3. Pod的 YAML 清单文件3.1 获取资源对象 YAML3.2 解析 YAML 清单文件(1)apiVersion查看 Kubernetes API 中全部的 API 组(2)kind查看 Kubernetes 中全部的对象资源类型(3)metadata(4&#…

SpringBoot整合Mybatis方式2:使用注解方式整合Mybatis

SpringBoot整合Mybatis简介SpringBoot整合Mybatis方式2:使用注解方式整合Mybatis1.先用idea创建一个添加mybatis需要的相关依赖的工程。2.准备数据库和表3.创建表映射类4.创建mapper代理接口5.创建Service层和Service的实现层6.创建控制层(也就是web层&a…

JQuery使用

简介 一个JavaScript的框架,简化了JS的语法和操作,定义了HTML属性操作、样式操作、DOM 操作等相关函数,实现了对ajax异步请求封装。提供了很多预定义函数的JS文件。 作用 简化部分JavaScript开发 使用步骤 1,引入Jquery 下载 地址1:http:/…

D-0015 红外接收硬件电路设计

红外接收硬件电路设计1 简介2 硬件电路实战3 红外遥控的原理4 主要参数5 电路设计要点1 简介 肉眼可见的光,按照波长进行排列依次为:红、成、黄、绿、青、蓝、紫。其中红光的波长范围为0.620.76μm;紫光的波长范围为0.380.46μm。比紫光波长…

[iOS]代码混淆

混淆有几点注意: 不能混淆系统方法 不能混淆init开头的等初始化方法 混淆属性时需要额外注意set方法 如果xib、 storyboard中用到了混淆的内容,需要手动修正。 可以考虑把需要混淆的符号都加上前缀,跟系统自带的符号进行区分。 混淆有风险&am…

MMEdu离线版的使用:实现石头剪刀布图像分类的检测

一、MMEdu离线版的使用 1.双击XEdu v1.0.exe解压缩到某个盘,会是一个文件夹XEdu 2.进入XEdu,双击运行“点我初始化.bat”,等待至运行结束命令提示符窗口自动关闭 3.双击运行“jupyter编辑器.bat”,将会打开一个网页版jupyter&…