5 月 17 号以“当 SQL 遇见 AI”为主题的 OceanBase 开发者大会在广州举行,因为行程的原因未能现场参会,仍然通过视频直播观看了全部的演讲。总体来说,这届大会既有对未来数据库演进方向的展望,也有 OceanBase 新产品的发布,还有当前行业用户使用 OceanBase 数据库的经验分享,可谓是干货满满。
全面拥抱 Data*AI 战略
2025 年可以说是 AI 元年,各大厂商都在积极的将自己的产品纳入到 AI 框架中,OceanBase 也不例外。蚂蚁金服 CTO 何征宇在演讲中指出,AI 的本质仍然是数据,决定了智能的上限。然而当前获取数据的成本越来越高、行业数据流通难、多模态数据处理难以及数据质量评估难等几大问题,制约了 AI 在行业中的落地和推广应用。
OceanBase 的 Data*AI 战略,致力于打造一个数据底座,通过一套架构同时支持 TP/AP/AI 混合负载,既支持向量检索,又能实现 SQL 与 AI 的混合检索,实现数据与模型的深度一体化融合。
积极拓展 AI 数据底座能力
说到 AI 总是离不开向量数据库,当大模型的数据无法触及到更专业更精准的领域时,将专业数据向量化保存到数据库中,是大模型最好的补充。OceanBase 向量数据库经过多个版本的迭代,其处理性能已经超过业界主流开源向量数据库。
和 Data*AI 战略相呼应,本次大会上正式发布 OceanBase PowerRAG,打造面向 AI 时代开箱即用的 RAG 服务。PowerRAG 提供 Document(文档)和 Chat(对话)两个核心 API 接口,打通应用开发数据层、平台层、接口层与应用层的全流程,帮助用户实现文档知识库、智能对话、图像比对、数据分析等多种 AI 应用场景的快速开发。
传统能力持续增强
OceanBase 架构演进上有两个最重要的版本迭代,一是 2016 年 1.0 版本实现了所有节点的可读可写,另一个是 2020 年的 4.0 版本提出的单机分布式一体化架构,能够在一套系统中同时实现分布式的扩展性和单机性能。在夯实了高可用基础,实现稳定的性能之后,OceanBase 也在向更多的领域扩展。
-
正式推出 OceanBase 企业级单机版,支持非核心的系统更轻量的使用 OceanBase 数据库;桌面版甚至能够在 2C6G 配置的笔记本上运行。相比于集群版动辄几十 G 的内存来说,单机版和桌面版大大降低用户的使用门槛; -
全新发布面向对象存储的“共享存储”产品形态,成为业界首个在 TP 场景下支持对象存储的多云原生数据库。成本角度看,在 TP 负载下,存储成本降低 50%;在 AP 负载下,存储成本最高可降低为原来的 1/10。相对于 Share Nothing,在计算节点扩容时不需要进行数据迁移,具有更快的速度和弹性; -
OceanBase 4.3.5 也是首个面向 AP 场景功能完备的 LTS 版本。针对一系列 AP 数据库的能力进行了增强,如支持堆表组织表,适应 AP 中经常大批量数据导入而数据又无序的场景;增强了嵌套物化视图功能,满足数据加工和预处理的需求;未来还将持续和 Iceberg 等数据湖的集成,通过 OceanBase 访问外部数据会更加便利。
写在最后
经过 10 多年的发展,OceanBase 已经成为最流行的开源中国数据库之一,连续两年占据墨天轮国产数据库排行榜的首位。自 2021 年 6 月 1 号开源以来,已经有超过 1500 个企业用户选择使用 OceanBase,社区集群安装量已经超过 52000 套,而且这个趋势还在不断的加速中。
自笔者开始关注以来,OceanBase 在产品能力和市场拓展上取得了非常大的成就。 在 AI 元年 OceanBase 也适时推出了 Data*AI 的战略,相信在不久的将来也会看到 OceanBase 在 AI 领域更大的成功。