Flink被阿里收购4年,最开心的却是Spark背后的Databricks

news2025/7/16 19:23:58

最近,Flink Forward Asia(FFA)峰会成功举行,有关Flink的讨论,又开始在国内热闹起来。

2022 年,Apache Flink 社区保持快速发展:GitHub Star 数突破 2 万,单月下载量突破 1400 万次;
Apache Flink 项目所有 PR 中有 45% 来自中国开发者;
Apache Flink 已成为实时流计算全球范围事实标准。
从峰会给出的数据来看:Flink确实已经发展的越来越好,无论是技术层面还是使用规模。

但要指望Flink哪天能够像Spark背后的母公司Databricks那样,估值几百亿美金,估计有点难。

因为从Flink被阿里收购的那一刻起,它的商业化就充满了困难。

01

Flink商业前景为何不如Spark

2019年,阿里巴巴以9000万欧元收购了Flink背后的公司 Data Artisans。

在这里插入图片描述
阿里收购Data Artisans

作为阿里掌管的Flink,开源版本到底做什么不做什么,阿里就有很大的发言权和控制权。

阿里巴巴如果要说服其他云厂商,比如腾讯云、华为云,或者AWS、 Azure等都上一个好用的Flink服务,其他人就会在想,你阿里巴巴掌握了开源,还能够在自己的云上做一个更好的闭源系统,我们怎么和你做竞争。

在这里插入图片描述
2021年全球云计算市场份额

开源项目由一家公有云公司主导,还是一个计算引擎,直接的结果,就是各大公有云公司都觉得没办法玩了。

所有的云厂商都有顾虑,都很难推出自己的针对开源Flink的增强版本。

而阿里巴巴当然是有机会推出针对Flink的增强的商业版本的,而且还能够很好兼容开源的Flink,但是客户未必敢用了。

知乎关于Flink的讨论

客户觉得,我一方面用了你的商业版本,一方面又必须/不得不上你的公有云,被你绑得死死的,那我怎么办?

所以:客户肯定是不到万不得已绝不上Flink,先用其他工具吧。万不得已要上Flink,最好也就上一个自己搭的开源版了。

02 Spark为什么能成功

Spark的母公司,Databricks之所以能成功,有一个很重要的因素,它是云厂商中立的。它既存在于AWS,也上了Azure,也登入了GCP甚至阿里巴巴的云端。

在这里插入图片描述
Azure Databricks

这样的做法,可以让很多企业放心,包括可以让各大云厂商放心使用。

Databricks可以搞一个商业版,里面有更多的功能,更好的和Spark兼容但是提供更高效的处理引擎等等,这没什么问题。

各大云厂商,也可以自己搞Spark的增强版,互相之间在不同云平台PK,问题都不大。

因为开源的Spark,还是在一家云中立公司的掌控中。这家公司本身,并没有特别偏好某个云。

03 Flink技术上确实已经足够强大

Flink凭借 " 有状态的流计算 " 这个核心理念和特色,诞生之初就快速打败了上一代流计算引擎 Storm。

通过合流式计算和状态管理两项技术,Flink 不仅提供了高性能的纯流式计算,同时也在框架层通过分布式一致性快照技术,为用户提供了数据精准一致性保证。

在这里插入图片描述
当前支持应用场景

而在批计算方面,Flink 已经完成绝大部分工作,并日益成熟。目前 Flink 已经能够完整跑通批处理标准测试集 TPC-DS,已经达到主流批处理引擎水平。

此外:Flink 在 SQL 层提供了流批一体语义表达能力,即用户可以写一套 SQL,从而同时用在实时和离线两个场景,从而得到全增量一体化的数据开发体验。

在这里插入图片描述
新功能

这几年,Flink 社区在国内外技术会议上不断宣传推广,让 Flink 得到大量采用,各种应用场景也变得更加广泛,生态快速发展。

Flink 不再仅仅是流计算引擎,而是让绝大部分数据分析师都可以利用 Flink批流一体 API 搭建实时数据集成、分析、风控和在线机器学习场景解决方案。

麦聪软件,全球领先的DaaS厂商,帮助企业构建开放体系湖仓架构,最大化支持原有数据库/数据仓库/数据湖/中台等。目前的400多家企业级客户中,30多家为世界500强集团客户。产品主要拥有统一数据管理和统一数据服务两大模块,包含构建数据资产目录,元数据管理,数据开发、数据质量、数据服务相关功能。

04总结

综上,Flink的技术是牛的,未来能发展的更好,但如果一个很好的计算引擎,没办法做到公有云厂商中立,那么在云计算市场的商业化就会难一点。

在这里插入图片描述
Databricks年度融资及估值变化

自从阿里巴巴买了Flink以后,也许最开心的就是Databricks。(19年阿里收购Flink,Databricks估值27.5亿美元,2021年其估值达到380亿美元)

大家怎么看,会建议自己的公司用Flink吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/51750.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

学习总结 | 下一代人工智能

文章目录 一、前言二、底层逻辑三、六大维度今后发展的方向是第三代人工智能,最主要的措施就是把第一代人工智能知识驱动的方法和第二代人工智能数据驱动的方法结合起来,发展安全、可信、可靠和可扩展的人工智能技术,从而推动人工智能的创新应用。 一、前言 中国科学院院士…

iTOP3A5000开发板多路PCIE、SATA、USB3.0等

iTOP3A5000开发板多路PCIE、SATA、USB3.0等 桥片:支持PCIE3.0、USB3.0、SATA3.0、显示接口2路、HDMI和1路VGA、可直接连显示器,另外内置一个网络PHY,片内集成了自研GPU、搭配32位DDR4显存接口,支持16GB显存容量。 底板引出多路PCI…

第3关:添加数据、删除数据、删除表

为了完成本关任务,你需要掌握:1.如何使用HBase shell命令添加数据、2.如何使用命令删除表。 首先启动HBASE 启动HBASEshell 添加数据 我们来给上一关创建的test表的列data添加一些数据: hbase(main):002:0> create test,data Created t…

在 Python 中构建一体化音频分析工具包,在一个地方分析您的音频文件

语言构成了人类之间每次对话的基础。因此,自然语言处理(或简称 NLP)领域无疑在帮助人类日常生活方面具有巨大潜力。 简而言之,NLP 领域包含一组旨在理解人类语言数据并完成下游任务的技术。 NLP 技术涵盖许多领域,例如问答 (QA)、命名实体识别 (NER)、文本摘要、自然语言…

0111 栈与队列Day1

剑指offer09.用两个栈实现队列 用两个栈实现一个队列。队列的声明如下,请实现它的两个函数 appendTail 和 deleteHead ,分别完成在队列尾部插入整数和在队列头部删除整数的功能。(若队列中没有元素,deleteHead 操作返回 -1 ) 示例 1&#x…

音视频开发入门小知识

什么是视频 视频就是由一系列图片构成的,当画面快速切换时,人眼看起来就感觉是连贯的动作。 视频帧 帧,表示一张画面,就是一帧。一个视频就是由许许多多帧组成的。 帧率 帧率,表示单位时间内帧的数量,…

KingbaseES数据库 kdb_schedule 自动定时任务

KingbaseES数据库 kdb_schedule 自动定时任务 文章目录KingbaseES数据库 kdb_schedule 自动定时任务前言一 安装插件 kdb_schedule1. 添加kdb_schedule2. 修改kdb_schedule所需参数:3. 重启数据库4. 加载kdb_schedule插件二 dbms_scheduler2.1 创建program创建progr…

(四) 共享模型之管程【Monitor 概念】

一、Java 对象头(P75) 二、原理之 Monitor(锁) Monitor 被翻译为监视器或管程。 每个 Java 对象都可以关联一个 Monitor 对象,如果使用 synchronized 给对象上锁(重量级)之后,该对象头的 Mark Word 中就被设…

Cookie Session JSP

这里写目录标题1 Cookie1.1 会话介绍1.2 Cookie 介绍1.3 Cookie 属性1.4 Cookie 方法1.4.1 Cookie 添加和获取1.5 Cookie 的使用1.6 Cookie 的细节2 Session2.1 HttpSession 介绍2.2 HttpSession 常用方法2.3 HttpSession 获取2.4 HttpSession 的使用2.5 HttpSession 的细节3 J…

高压功率放大器在超声驻波声场的听声器中的应用

实验名称:高压功率放大器在超声驻波声场的听声器声压测量中的应用 研究方向:3D打印 测试目的:利用听声器对声场的测量是一种基于对声压的采集,利用CPB分析及FFT分析处理,得到涉入点声压的方法。介于听声器采集信号为时…

单字段纵向分栏

【问题】 Hi, I’m trying to display BIRT report Data (only one field) first vertically till the page ends and then it should continue in the next column of the same page. For example as A E I B F J C G D HBy using list element I’m able to get the data …

opencv上设置摄像头曝光参数的经验

实际应用中我们需要调整摄像头的参数比如曝光,由于opencv的后端是一般编译是支撑多种插件,详细信息请参考OpenCV: Video I/O with OpenCV Overview,这里引用里面的图: 对于VideoCaputure,后端有ffmpge,V4L&…

SpringMVC入门

SpringMVC 一、SpringMVC简介 1、什么是MVC MVC是一种软件架构的思想,将软件按照模型、视图、控制器来划分 M:Model,模型层,指工程中的JavaBean,作用是处理数据 JavaBean分为两类: 一类称为实体类Bea…

软件工程SSM毕设项目 - 基于SSM的中药店商城网站(含源码+论文)

文章目录1 项目简介2 实现效果2.1 界面展示3 设计方案3.1 概述3.2 系统流程3.3 系统结构设计4 项目获取1 项目简介 Hi,各位同学好呀,这里是M学姐! 今天向大家分享一个今年(2022)最新完成的毕业设计项目作品,【基于SSM的中药店商…

微信小程序能给花店带来哪些作用_分享花店微信小程序开发优势

在开发过小程序的线下实体店铺中,有不少花店。开发了小程序的花店纷纷表示:"小程序提供了非常大的帮助,现在越来越离不开小程序了"。那么,小程序能给花店带来哪些帮助? 1、提升店铺曝光半径挖掘更多流量 对…

哈希表题目:键盘行

文章目录题目标题和出处难度题目描述要求示例数据范围解法思路和算法代码复杂度分析题目 标题和出处 标题:键盘行 出处:500. 键盘行 难度 2 级 题目描述 要求 给你一个字符串数组 words\texttt{words}words,只返回可以使用在美式键盘…

Scala集合习题Ⅱ

行是知之始,知是行之成。——陶行知 目录 练习题 3 :求出各城市的平均温度 练习题4:请用scala得出以下的结果 练习题 3 :求出各城市的平均温度 val d1 Array(("bj", 28.1), ("sh", 28.7), ("gz"…

RK3588平台开发系列讲解(PWM篇)PWM及backlight的使用方法

平台内核版本安卓版本RK3588Linux 5.10Android12🚀返回专栏总目录 文章目录 一、PWM驱动二、DTS配置三、PWM在user space的使用四、PWM在背光中的使用4.1 Backlight DTS4.2 PWM Backlight 调试沉淀、分享、成长,让自己和他人都能有所收获!😄 📢本篇将介绍PWM以及backli…

SpringBoot结合Quartz实现定时任务

《从零打造项目》系列文章 工具 比MyBatis Generator更强大的代码生成器 ORM框架选型 SpringBoot项目基础设施搭建SpringBoot集成Mybatis项目实操SpringBoot集成MybatisPlus项目实操SpringBoot集成Spring Data JPA项目实操 数据库变更管理 数据库变更管理:Liquibase…

深入讲解Netty那些事儿之从内核角度看IO模型(上)

我们都知道Netty是一个高性能异步事件驱动的网络框架。 它的设计异常优雅简洁,扩展性高,稳定性强。拥有非常详细完整的用户文档。 同时内置了很多非常有用的模块基本上做到了开箱即用,用户只需要编写短短几行代码,就可以快速构建…