Teradata在华落幕,国产化崛起,袋鼠云数栈会是更好的选择吗?

news2025/7/28 0:08:56

2月15日,数仓软件巨头Teradata宣布根据其对中国当前和未来商业环境的慎重评估,将逐步结束在中国的直接运营,后续进入中国公司的关闭程序。

一石激起千层浪,这一消息,在国内的To B市场引起了广泛关注。Teradata这家进入中国市场26年,为国内数仓发展带来重要启蒙,奠定数据服务人才基础,被业界称之为 “数仓人才黄埔军校”的数据软件巨头如今在华落幕,令人感叹。

近些年来,国产大数据基础建设百花齐放、发展蓬勃,中国软件企业在信创产业政策的助攻下,迎来了发展的黄金期,技术和产品能力快速提升,凭借自主可控、创新安全等优势,已经逐步实现对Teradata等国外主流软件的成功替换。

其中包括以Hadoop体系为主的CDH、星环,袋鼠云等公司,以国产化数据库为主的阿里云ADB、华为GussDB、南大通用GBase等数据库厂商,都纷纷在国产化领域交出了不错的成绩单。

袋鼠云从2016年开始一直深耕于大数据领域,以卓越的技术能力服务3000+客户,涉及行业解决方案、大数据产品、数仓交建模交付、数据分析等多个领域。在产品和国际同行之间差距不断缩小的同时,这次Teradata的离开,我们也在思考在这块市场上袋鼠云可以为客户提供什么样的服务。

Teradata无缝迁移至数栈-EasyMR

Teradata是一个MPP数据库,采用share nothing架构,每个节点拥有自己的资源,如CPU、内存、磁盘等,每个APM管理自己的数据协同工作,通过BYNET进行网络互联。在业务场景上,主要应用于数据建模与分析。

file

该类数据库SQL兼容性好,支持事物处理、PB级别结构化数据处理速度快,但集群规模调整要求多,增加节点麻烦,单节点缓慢会拖累整体性能,在大数据量的处理任务上,有支持能力严重不足的问题。

如果客户数据量大,存储和计算成本较高,建议采用Hadoop大数据计算引擎生态,其兼容能力强、扩展性高,基于HDFS进行结构化、非结构化数据存储,Spark、Flink、Trino多类计算引擎可以满足不同分析场景。

袋鼠云数栈自研的大数据基础平台「EasyMR」,是基于Hadoop、Hive、Spark、Flink、HBase、Kafka、Trino等开源组件,构建的弹性计算引擎,提供安全可靠、弹性伸缩、低成本的大数据存储与计算服务。

于2017年投入商业化使用以来,交付过500+商业化客户,覆盖金融、政务、制造、教育等多个行业,期间开源ChunJun、Taier、ChengYing等项目,贡献给开源社区。并于2022年推出EasyMR数据湖版本,在业务场景驱动下,不断完善技术体系,服务大数据市场。

file

EasyMR可提供的场景解决方案

· ChunJun数据同步插件:双向异构数据源、批流一体的数据同步插件,实现业务数据库向大数据数仓的数据同步,可进行数据整库同步、批同步、实时同步;

· Spark+Hive:分布式离线数据仓库建设,进行数据批处理;

· Spark+Hive+Iceberg/Hudi:离线数仓批处理+数据即时更新;

· Kafka+Flink:实时数据仓库建设;

· Flink+Kafka+Iceberg/Hudi:批流一体化;

· Trino+Hive:OLAP引擎进行亿级数据关联的秒级查询;

· ClickHouse:OLAP引擎进行宽表的毫秒级查询;

· HBase:大数据量存储,高并发快速查询。

Teradata数据库迁移至EasyMR,数栈可提供的服务

· 历史数据的整库迁移;

· Teradata SQL任务的平滑迁移。

袋鼠云大数据基础平台「EasyMR」秉承“信创、开源、轻量、专业”的理念提供安全可靠的大数据存储与计算服务,为企业数字化转型提供基石。

数栈兼容Teradata Vantage数据分析

Teradata Vantage 是一个云计算数据分析平台,提供数据汇聚与建模、数据服务与分析、机器学习建模等能力,同时预置行业数据模型,如FS-LDM涵盖银行、证券、保险的10大主题模型,为客户提供数据分析服务。

袋鼠云数栈提供一站式大数据开发与治理、数据智能分析与洞察、机器与深度学习建模等产品化应用,涵盖离线开发、实时开发、数据资产、数据服务、指标管理分析、客户数据洞察等平台。

提供大数据汇聚、数仓建模、数据治理、数据服务、数据分析的全生命周期能力,并基于Dataops理念构建数据生产流程,加快数据分析链路,为企业数据治理提供易用、稳定的数据平台,达到降本增效的目的。

file file

袋鼠云数栈产品矩阵

· 离线开发平台BatchWorks:一站式大数据批处理平台,涵盖全链路数据集成、数据开发、任务运维、监控告警等功能,具备灵活的多集群、多引擎对接能力,加速释放数据价值;

· 实时开发平台Streamworks:基于Apache Flink 构建的云原生一站式大数据实时平台,覆盖从实时数据采集到实时数据开发全链路流程,提供亚秒级的数据计算处理;

· 数据资产平台DataAssets:采集全量资产数据,打通数据关系网络,实现数据的标准化和资产化管理,提供全域数据治理能力;

· 数据服务平台EasyAPI:可视化生成与注册 API 的数据服务管理平台,快速构建 OneService 数据共享服务;

· 指标管理分析平台EasyIndex:通过指标的规范化定义、标准化开发,搭建企业数据指标体系与自助取数服务,实现指标数据的可视、可用、可管;

· 客户数据洞察平台DataTag:通过标签萃取、标签管理、标签圈群、群组分析、全面画像,构建以业务价值为导向的标签体系和多样化群组,应用于企业智能化运营与营销;

· 数据湖平台EasyLake:提供面向湖仓一体的数据湖管理分析服务,基于统一的元数据抽象构建一致性的数据访问,提供海量数据的存储管理和实时分析处理能力,帮助企业快速构建湖仓一体化平台。

同时,数栈基于在金融、政府、制造、教育等各个行业的客户场景沉淀,产品内置多种行业的数据标准、数仓模型、指标体系、标签体系,为企业数据建设提供参考与赋能,以及提供全国性、本地化的行业咨询与数据交付实施服务。下面简单举几个例子:

● 数据标准行业模板

file

● 指标体系行业模版

file

● 标签体系行业模版

file file

不止于此,数栈提供全生命周期的数据建模与服务能力,并预置多种行业模型,为企业数字化转型提供框架与动能。

国产信创,数栈在路上

2月22日,总书记在政治局集体学习会议上强调:“要打好科技仪器设备、操作系统和基础软件国产化攻坚战,提升国产化替代水平和应用规模,争取早日实现用我国自主的研究平台、仪器设备来解决重大基础研究问题。“

近些年来,在国家政策指导下,企业数字化基础设施逐步国产化。袋鼠云作为国内领先的数字化技术与服务提供商,始终坚持自主研发和国产化路线,高度重视技术创新,公司研发费用逐年提升,研发费用占比高达20%以上,高于行业研发投入的平均水平。

目前,袋鼠云已与麒麟软件、中科方德、浪潮云、华为云、阿里云、瀚高、龙芯科技、中兴通讯等16家国内主流操作系统、服务器、数据库、芯片厂商完成产品兼容性互认证。这大大提升了袋鼠云旗下产品在国内企业应用环境中的兼容性和扩展性,在软硬件层面全面兼容X86、ARM、MIPS架构体系,支持市面所有公有云、私有云、混合云厂商平台,支持CDH、TDH、Libra、Fushionlnsight等存储引擎。

未来,袋鼠云将继续秉承“让数据创造价值”的使命,在大数据道路上持续深耕,为企业的数字化转型贡献自己的一份力量。 想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szcsdn

同时,欢迎对大数据开源项目有兴趣的同学加入我们,一起交流最新开源技术信息,号码:30537511,项目地址:https://github.com/DTStack

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/368116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mongoDB的安装与使用

MongoDB安装MongoDB官方网站:https://www.mongodb.com/try/download/community-kubernetes-operator2软件安装权限不足:https://www.javaclub.cn/database/56541.htmlstep1:打开安装包直接点击Nextstep2:继续点击Nextstep3:点击自…

Oracle 12C以上统计信息收集CDB、PDB执行时间不一致问题

文章目录前言一、统计信息窗口期调查二、时区调查三、查询alert记录四、why Database Statistic Collection Job is running two times inside a Maintenance Window?五、Default Scheduler Timezone Value In PDB$SEED Different Than CDB六、总结前言 在实际工作中发现一个…

Tina_Linux_功耗管理_开发指南

Tina Linux 功耗管理开发指南 1 概述 1.1 编写目的 简要介绍tina 平台功耗管理机制,为关注功耗的开发者,维护者和测试者提供使用和配置参考。 1.2 适用范围 表1-1: 适用产品列表产品名称内核版本休眠类型参与功耗管理的协处理器R328Linux-4.9NormalS…

ESP32设备驱动-MLX90393磁场传感器驱动

MLX90393磁场传感器驱动 文章目录 MLX90393磁场传感器驱动1、MLX90393介绍2、硬件准备3、软件准备4、驱动实现1、MLX90393介绍 MLX90393 磁场传感器可以在运行时重新编程为不同的模式和不同的设置。 该传感器使用 Melexis 专有的 Triaxis 技术提供与沿 XYZ 轴感应的磁通密度成…

Matplotlib之画图模块

目录 matplotlib简介 条形图 折线图 散点图 matplotlib简介 Matplotlib 是 Python 的绘图库,它能让使用者很轻松地将数据图形化,并且提供多样化的输出格式。 Matplotlib 可以用来绘制各种静态,动态,交互式的图表。 Matplotli…

OpenCV-PyQT项目实战(9)项目案例04:视频播放

欢迎关注『OpenCV-PyQT项目实战 Youcans』系列,持续更新中 OpenCV-PyQT项目实战(1)安装与环境配置 OpenCV-PyQT项目实战(2)QtDesigner 和 PyUIC 快速入门 OpenCV-PyQT项目实战(3)信号与槽机制 …

mars3d对geojson图层分属性设置样式

开发中可能会遇到如下需求,在全省的数据中按某个属性⾼亮展示某市区。此时就需要使⽤分属性样式的api了。⽂档如下。GeoJsonLayer - Mars3D API文档属性是根据⽮量数据的属性进⾏匹配。可以通过 layer.graphics[0]?.attr ⽅式获取。 指导有哪些属性之后先设置…

Spark3 新特性之AQE

文章目录Spark3 AQE一、 背景二、 Spark 为什么需要AQE? (Why)三、 AQE 到底是什么?(What)四、AQE怎么用?(How)4.1 自动分区合并4.2 自动数据倾斜处理4.3 Join 策略调整五、对比验证5.1 执行耗时5.2 自动分区合并5.3 自动数据倾斜处理六、结论Spark3 AQ…

电脑录屏怎么操作,操作步骤详解,2023新版

在日常的学习、生活和工作中,当小伙伴想要分享一段游戏视频或者教学视频时,电脑录屏就显得尤为重要了。但是小伙伴你是否知道电脑录屏怎么操作?今天小编就分享电脑录屏操作步骤的详细教程,一起来看看吧。 电脑录屏怎么操作1&#…

【剑指Offer】重建二叉树(递归+迭代)

重建二叉树一、递归法二、迭代法题目链接 题目描述: 输入某二叉树的前序遍历和中序遍历的结果,请构建该二叉树并返回其根节点。 假设输入的前序遍历和中序遍历的结果中都不含重复的数字。 示例 1: Input: preorder [3,9,20,15,7], inorder [9,3,15,…

C进阶:7.程序环境和预处理

目录 1.程序的翻译环境和执行环境 2.详解编译 链接 2.1翻译环境 2.2编译本身也分为几个阶段: 2.3运行环境 3.预处理详解 3.1预定义符号 3.2 #define 3.2.1 #define 定义标识符 3.2.2 #define 定义宏 3.2.3 #define 替换规则 3.2.4 # 和 ## 3.2.5带副…

大规模食品图像识别:T-PAMI 2023论文解读

美团基础研发平台视觉智能部与中科院计算所展开科研课题合作,共同构建大规模数据集Food2K,并提出渐进式区域增强网络用于食品图像识别,相关研究成果已发表于T-PAMI 2023。本文主要介绍了数据集特点、方法设计、性能对比,以及基于该…

Unreal Engine 虚幻引擎,性能分析,优化(二)

一、CPU 性能分析 如渲染线程中出现 CPU 受限,原因可能是绘制调用过多。这是一个常见问题,美术师通常会将绘制调用进行组合,从而减少消耗(如:将多个墙壁组合为一个网格体)。实际消耗存在于多个区域中&…

Ubuntu 22.04.2 发布,可升级至 Linux Kernel 5.19

Ubuntu 22.04 LTS (Jammy Jellyfish) Ubuntu 22.04.2 发布,可升级至 Linux Kernel 5.19 请访问原文链接:Ubuntu 22.04 LTS (Jammy Jellyfish),查看最新版。原创作品,转载请保留出处。 作者主页:www.sysin.org 发行说…

file_get_contents 打开本地文件报错: failed to open stream: No such file or directory

php 使用file_get_contents时报错 failed to open stream: No such file or directory (打开流失败,没有这样的文件或目录) 1. 首先确保文件路径没问题 最好是直接复制一下文件的路径 2. windows电脑可以右键该文件 → 属性→安全 →对象名称 选中后复制一下 3. 然后…

【数据存储】浮点型在内存中的存储

目录 一、存储现象 二、IEEE标准规范 1.存储 2.读取 三、举例验证 1.存储 2.读取 浮点型存储的标准是IEEE(电气电子工程师学会)754制定的。 一、存储现象 浮点数由于其有小数点的特殊性,有很多浮点数是不能精确存储的,如&#…

【unittest学习】unittest框架主要功能

1.认识unittest在 Python 中有诸多单元测试框架,如 doctest、unittest、pytest、nose 等,Python 2.1 及其以后的版本已经将 unittest 作为一个标准模块放入 Python 开发包中。2.认识单元测试不用单元测试框架能写单元测试吗?答案是肯定的。单…

UNIAPP实战项目笔记58 注册成功信息存储到数据库

UNIAPP实战项目笔记58 注册成功信息存储到数据库 注册时候验证手机验证码 验证码通过后讲用户信息存入数据库 实际案例图片 后端接口文件 index.js var express require(express); var router express.Router(); var connection require(../db/sql.js); var user require(…

爱奇艺“资产重定价”:首次全年运营盈利是拐点,底层逻辑大改善

长视频行业历时一年有余的降本增效、去肥增瘦,迎来首个全周期圆满收官的玩家。 北京时间2月22日美股盘前,爱奇艺发布2022年Q4及全年财报,Q4 Non-GAAP净利润明显超越预期,且首次实现全年运营盈利。受业绩提振,爱奇艺盘…

SpringSecurity源码分析(二) SpringBoot集成SpringSecurity即Spring安全框架的执行过程

在上一篇文章中我们描述了SpringSecurity的执行过程。我们我们了解到了以下内容 在SpringSecurity框架中有三个非常核心的类和接口,分别是 1.SecurityFilterChain接口 2.FilterChainProxy类 3.DelegatingFilterProxy类 springboot项目中,客户端向Tomcat …