Transwarp Inceptor介绍

news2025/7/14 3:13:19

Transwarp Inceptor是星环科技推出的用于数据仓库和交互式分析的大数据平台软件,它基于Hadoop和Spark技术平台打造,加上自主开发的创新功能组件,有效的解决了企业级大数据数据处理和分析的各种技术难题,帮助企业快速的构建和推广数据业务。

Transwarp Inceptor可提供完整的SQL支持,支持主流的SQL模块化扩展,兼容通用开发框架和工具,支持事务特性保证数据的准确性,允许多租户的隔离与管理,且能够利用内存或者SSD来加速数据的读取,支持与关系型数据库实时对接并做统计分析,辅以高性能的SQL执行引擎,为企业提供高性价比和高度可扩展的解决方案。

Inceptor中星环科技自主开发的创新组件包括:

  • SQL编译器 SQL 2003 Compiler

企业级数据仓库、数据集市等应用大多基于SQL开发,而Hadoop业界的产品大部分对SQL的兼容程序比较差,或者不支持SQL的模块化扩展,因而应用迁移的成本非常高,甚至是不具备可行性。

为了降低应用迁移成本,Transwarp Inceptor开发了完整的SQL编译器,支持ANSI SQL 92和SQL 99标准, 支持ANSI SQL 2003 OLAP核心扩展,可以满足绝大部分现有的数据仓库业务对SQL的要求,方便应用平滑迁移。

除了更好的SQL语义分析层,Inceptor还包含强大的优化器保证SQL在引擎上有最佳的性能。Inceptor包含3级优化器:首先是基于规则的优化器,应用静态优化规则生成一个优化的逻辑执行计划;其次是基于成本的优化器,通过衡量多个不同执行计划的CPU、IO和网络成本,选择一个相对更合理的计划并生成物理执行计划;最后是代码生成器,对一些比较核心的执行逻辑生成更高效的执行代码或者Java Byte Code,从而保证SQL业务在分布式平台上有最佳性能。

  • 存储过程编译器 PL/SQL Compiler

国内现有的数据仓库应用大都基于SQL 2003,且大量使用存储过程来构建复杂应用。因此为满足需求,除了SQL编译器以外,Transwarp Inceptor还包含存储过程编译器用于对存储过程的编译和执行。

Inceptor支持SQL2003标准,存储过程,兼容Oracle、DB2、Teradata方言,包括完整的数据类型、流程控制、Package、游标、异常处理以及动态SQL执行,并且支持在存储过程中做高速统计,增删改查与分布式事务 操作。因此,有了存储过程编译器的补充,Inceptor可以满足绝大部分数据应用的从关系型数据库到Inceptor平台的迁移。

除了SQL语法层面的支持,存储过程编译器包含一个完整的优化器,其中包括CFG Optimizer,Parallel Optimizer,和DAG Optimizer。CFG Optimizer主要用于对存储过程中的代码进行优化,完成循环展开,冗余代码消除,函数内联等主要优化。Parallel Optimizer用于将一些原本串行的逻辑做并行化处理,利用集群的计算能力来提高整体执行速度,对一些关键的功能如游标的性能提升非常明显。DAG Optimizer会根据生成的DAG进行二次优化,生成更合理的物理执行计划,重点降低Shuffle等任务开销。

为了有效兼容其他数据库,Inceptor支持通过不同的方言设置来隔离不同的SQL标准之间的差异,从而避免数据计算和处理标准的二义性,保证数据处理的正确性。

  • 事务管理单元 Transaction Manager

为了更好的满足数据仓库业务场景的需求,Inceptor提供完整的增删改SQL支持,允许从多数据源中加工数据。同时为了有效的保证数据处理的准确性,Inceptor提供分布式事务的支持,保证了处理过程中数 据的ACID(原子性、一致性、隔离性和持久性)。

Inceptor支持以Begin Transaction启动事务,以commit或者rollback来结束事务。事务管理单元通过两阶段封锁协议和MVCC来实现一致性和隔离性的控制,支持Serializable Snapshot Isolation隔离级别,因而可以保证并发情况下的事务一致性。

Inceptor支持SQL 2003中关于增删改查部分的语义规范,支持Insert,Update,Delete,Truncate以及Merge Into原语,支持单条或者从其他数据表以及嵌套查询中更新数据表,并且内置一致性检查功能以防止非法改动。

通过SQL编译器的优化,增删改SQL执行计划通过分布式引擎在集群中并发执行,系统整体的吞吐率可达关系数据库的数倍,能够满足批处理业务的高吞吐率要求。另外,通过合理的资源规划,Inceptor在 做数据的增删改的同时,允许租户对数据做高速的统计分析。

  • 分布式内存列式存储 Holodesk

为了加速交互式分析的速度,Inceptor推出了基于内存或者SSD的列式存储引擎Holodesk。Holodesk把数据在内存或者SSD中做列式存储,辅以基于内存的执行引擎,可以完全避免IO带来的延时,极大的提高数据扫描速度。

除了列式存储加快统计分析速度,Holodesk支持为数据字段构建分布式索引。通过智能索引技术为查询构建最佳查询方案,Inceptor可以将SQL查询延时降低到毫秒级。

Holodesk允许用户对多字段组合构建OLAP-Cube,并将cube直接存储于内存或者SSD,无需额外的BI工具构建Cube,因此对于一些复杂的统计分析和报表交互查询,Holodesk可实现秒级的反应。

除了性能优势,Holodesk在可用性方面也表现出色。Holodesk的元数据和存储都原生支持高可用性,通过一致性协议和多版本来支持异常处理和灾难恢复。在异常情况下,Holodesk能够自动恢复重建所有的表信息和数据,无需手工恢复,从而减少开发与运维的成本,保证系统的稳定性。

Inceptor重点优化了基于SSD的Holodesk性能,使得基于PCIE SSD的性能达到全内存方案的80%以上。因此结合使用低成本的内存、闪存混合存储方案,可接近全内存存储的分析性能,保证解决方案的高性价比。

  • 分布式执行引擎 Distributed Execution Engine

Inceptor基于Apache Spark深度开发了专用分布式计算引擎,不仅大幅提高了计算性能,而且有效的解决了Spark在稳定性方面的很多问题,确保计算引擎能够7x24小时无间断运行。此外,Inceptor引擎独立构建了分布式数据层,将计算数据从计算引擎JVM内存空间中独立出来,可以有效减少JVM GC对系统性能和稳定性的影响。

在SQL执行计划优化方面,Inceptor实现了基于代价的优化器和基于规则的优化器,辅以100多种优化规则,以保证SQL应用在无需手工改动的情况下能够发挥最大的性能。对于数据倾斜等常见的数据处理难题,执行引擎也能够自动识别并加以优化,可解决绝大部分存在数据倾斜的计算场景,杜绝数据倾斜对系统稳定性的影响。 +   为了更好的适应各种数据场景,Inceptor的执行引擎包含两种执行模式:低延时模式和高吞吐模式。低延时模式主要应用在数据量比较小的场景,执行引擎会生成执行延时低的物理执行计划,通过减少或避免一些高延时的任务(如IO,网络等)来保证SQL较短的执行时间,达到或者逼近关系型数据库在这些场景下的性能。高吞吐模式主要应用在大数据的场景,通过合理的分布式执行来提高超大数据量上的复杂统计分析的性能。因此,Inceptor的执行引擎可以满足从GB到PB的各种数据量上的数据业务需求。

  • 数据源连接器 Stargate

企业数据可能会分散在多个系统中,彼此无法共享数据或者进行相关的分析,从而造成数据孤岛的现象。构建统一的大数据平台可以有效的解决大部分场景下的数据孤岛问题。采用统一的大数据平台之后,会存在一些数据因为各种关系无法迁移统一平台上的现象。为了解决此类问题,Inceptor推出了数据源连接器Stargate。

Stargate是连接执行引擎和各种数据源的连接器,可将多种不同数据源的数据接入引擎做实时的统计分析,无需事先将数据导入HDFS,从而方便用户的业务构建多样化需求。

在语法层面,Inceptor兼容Oracle DB-Link规范,通过创建database link来预先建立和其他数据源的连接池,接着就可以在SQL中通过 table_name@database link的方式在Inceptor中实时访问该数据源的数据,无需其他操作。在执行计划开始后,Stargate通过预先建立的连接从其他数据源中抽取需要的数据,输入进入执行引擎层参与SQL计算。在计算完成后,释放相关的数据库连接以及对应的资源。

目前Stargate支持关系数据库包括Oracle,DB2,Mysql,Teradata以及PostgreSQL。此外,Stargate目前可以接入Holodesk,HDFS,Hyperbase等平台内数据源,未来将支持Redis等为数据源。

  • 中间件管理单元 Connector

Inceptor完整的支持JDBC4.0和ODBC3.5标准,因此能够支持Hibernate/Spring等中间件,完全兼容Tableau/QlikView/Cognos等报表工具,可以和企业当前的数据应用层完整对接。

此外,Inceptor也支持与其他数据同步工具的对接,已经完成了和IBM CDC的相互认证与整合,并且能够支持Oracle Golden Gate、SAP Data Service等工具。因此,企业用户可以实时的将交易数据同步到Inceptor内做交互式统计分析业务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/8553.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

进化吧,MySQL锁!无锁->偏向锁->轻量级锁->重量级锁(请自动脑补数码宝贝进化音)

写在前边 走到哪都有各种琐事,在MySQL中咱已经聊透了各种琐事 ->MySQL锁机制&&事务,今天来看看Java里边的锁升级过程,以及各种锁之间的比较,悲观乐观,粗化消除~ 四种锁的Markword 优先程度 偏向锁->轻量…

【FPGA】FPGA实现IIC协议读写EEPROM(三) ----- 汇总篇

IIC协议读写EEPROM一、功能分析/模块划分二、状态转移图1、EEPROM读写控制状态转移图2、IIC接口驱动状态转移图三、工程代码实现1、顶层模块2、EEPROM读写控制模块3、IIC接口驱动模块4、参数配置5、其他模块四、仿真测试五、上板验证写在前面 FPGA实现IIC协议读写EEPROM相关文章…

【附源码】计算机毕业设计JAVA教学辅助系统

项目运行 环境配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: Springboot mybatis Maven Vue 等等组成,B/…

【Qt】控件探幽——QWidget

注1:本系列文章使用的Qt版本为Qt 6.3.1 注2:本系列文章常规情况下不会直接贴出源码供复制,都以图片形式展示。所有代码,自己动手写一写,记忆更深刻。 本文目录探索QWidget1、ui文件最后会变成什么?2、如何改…

在 OpenHarmony 轻量设备开发应用

本文档旨在讲解新建 Helloworld 项目步骤、固件包烧录到 BES2600WM 开发板、实现 js 和 C 代码的通讯。该 Demo 重点体现的是 OpenAtom OpenHarmony(以下简称“OpenHarmony”) 3.1 Beta 系统轻量设备 js 和 C 的交互能力, 效果如图 &#xf…

dpdk PMD

PMD是Poll Mode Driver的缩写,即基于用户态的轮询机制的驱动 在不考虑vfio的情况下,PMD的结构图如下 虽然PMD是在用户态实现设备驱动,但还是依赖于内核提供的策略。其中uio模块,是内核提供的用户态驱动框架,而igb_uio…

深度探讨react-hooks实现原理

react hooks 实现 Hooks 解决了什么问题 在 React 的设计哲学中,简单的来说可以用下面这条公式来表示: UI f(data)等号的左边时 UI 代表的最终画出来的界面;等号的右边是一个函数,也就是我们写的 React 相关的代码&#xff1b…

最新最全面的Spring详解(一)——Spring概述与IOC容器

前言 本文为 【Spring】Spring概述与IOC容器 相关知识,下边将对Spring概述,IOC容器(包括:IOC概述、配置元数据、容器实例化与使用、Bean的概述、依赖注入 Dependency Injection、Bean 作用范围(作用域)、更…

计算机网络(二)

三、数据链路层 3.1 数据链路层概述 数据链路层在物理层提供的服务的基础上向网络层提供服务,其最基本的服务是将源自网络层来的数据可靠地传输到相邻节点的目标机网络层。数据链路层在不可靠的物理介质上提供可靠的传输。 该层的作用包括:物理地址寻址…

安装Redis

一、Windows安装 1、下载安装包 2、下载完毕得到压缩包 3、解压到自己电脑上的环境目录 4、开启redis,双击运行服务 5、使用redis客户端来连接redis 注意:Window下使用确实简单,但是Redis推荐我们使用Linux去开发使用! 二、Linux安装 1、官网下载…

everything常用搜索命令

参考:玩转Everything(三) https://baijiahao.baidu.com/s?id1735662355311796969&wfrspider&forpc 可右键菜单显示要显示的内容 指定目录搜索 例:e: 文件名 (注意加空格) 多目录内搜索 例&#x…

ModStartCMS v5.2.0 字段扩展支持,SiteMap增强

系统介绍 ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰…

多肽914910-73-9:血管紧张素Angiotensin(1-12)(mouse, rat)

血管紧张素 (1-12) 是局部生成血管紧张素的潜在前体。它在广泛的器官和组织中表达,包括小肠、脾脏、肝脏、肾脏和心脏。卡托普利和 CV-11974(一种血管紧张素 II I 型受体拮抗剂)可消除对静脉输注血管紧张素 (1-12) 的血管收缩和升压反应。编号…

【Linux详解】——环境变量

📖 前言:本期将介绍Linux下的环境变量 目录🕒 1. 基本概念🕘 1.1 常见环境变量🕘 1.2 查看环境变量方法🕘 1.3 其他指令:🕘 1.4 环境变量的来源🕒 2. 环境变量的操作&…

2022亚太杯建模A题思路分析 小美赛数学建模 A题思路

一、 2022亚太杯大学生数学建模竞赛 注册截止日期:北京时间2022年11月23日(星期三)中午12点 竞赛开始时间:北京时间2022年11月24日(星期四)上午6点 竞赛结束时间:北京时间2022年11月28日&#…

OpenCV实战(2)——OpenCV核心数据结构

OpenCV实战(2)——OpenCV核心数据结构0. 前言1. cv::Mat 数据结构1.1 cv::Mat 简介1.2 cv::Mat 属性1.3 完整代码示例2. 探索 cv::Mat 数据结构2.1 cv::Mat 对象的创建2.2 OpenCV 输入和输出数组小结系列链接0. 前言 cv::Mat 类是用于保存图像(以及其他…

2022 SPSSPRO杯A|B|C题全网最全解题思路+数据分享

一,认证杯数学建模2022 ABC题干分析 2022年第十五届“SPSSPRO杯”数学中国数学建模网络挑战赛 2022认证杯数学中国数学建模网络挑战赛 认证杯这次叫spssrpo 二,A题 人员的紧急疏散 在过去的几十年里,由于大规模集会活动的数量和规模的增加…

大数据采集工具与采集业务划分

目录1- FlumeAgentSourceChannelSinkEvent2- Fluentd3- Logstash4- Chukwa5- Scribe6- Splunk7- Scrapy8- Kafka9- Datax10-日志采集11-数据源数据同步1- Flume https://flume.apache.org/ Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志…

代码随想录56——动态规划:583两个字符串的删除操作、72编辑距离

文章目录1.583两个字符串的删除操作1.1.题目1.2.解答2.72编辑距离2.1.题目2.2.解答1.583两个字符串的删除操作 参考:代码随想录,583两个字符串的删除操作;力扣题目链接 1.1.题目 1.2.解答 本题和 动态规划:115.不同的子序列 相…

在Python中 先乘再除 和 先除再乘 是有差别的

浮点数的原因<font colorblue size4 face"楷体">1 问题来源<font colorblue size4 face"楷体">2 为什么会这样&#xff1f;<font colorblue size4 face"楷体">2.1 分解公式<font colorblue size4 face"楷体">…