GreenPlum6.x之测试数据

news2025/7/8 11:48:36

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档

文章目录

  • 前言
  • 一、generate_series是什么?
  • 二、使用步骤
    • 1.建张测试表
    • 2.插入简单的测试数据
    • 3.查看数据分散情况
    • 4.通过SQL测试性能
  • 总结


前言

提示:这里可以添加本文要记录的大概内容:

分布式关系型数据库集群搭建好了,试下是否如网上所述处理的数据具有高性能的优势,所以导入500万条测试数据进行简单的试下


提示:以下是本篇文章正文内容,下面案例可供参考

一、generate_series是什么?

GreenPlum是基于PostgreSQL - 使用generate_series函数生成大量测试数据。
generate_series(start, stop, step)函数
生成一个数值型序列,从 start 到 stop,步进为 step。

列: select * from generate_series(2,4); 结果为 2,3,4

二、使用步骤

1.建张测试表

代码如下(示例):

create table gpdb.test1

(uid varchar(10),gnd varchar(4),

name varchar(100),phone varchar(11)

)distributed by (uid);

2.插入简单的测试数据

代码如下(示例):

insert into test1

(uid,gnd,name,phone)

select

floor(random()*10000000000)

,(array['男','女','其他'])[floor(random()*3)::int+1]

,(array['小四','小花','小凡'])[floor(random()*3)::int+1] 

,floor(random()*(10000000000-13899999999)+13899999999) 

from generate_series(1,5000000);

3.查看数据分散情况

代码如下(示例):

select  gp_segment_id,count(*) from test1 group by 1

在这里插入图片描述
我搭建的环境部署了3个segment数据节点
500万数据分布在3个数据节点
在这里插入图片描述

4.通过SQL测试性能

代码如下(示例):

select phone ,count(*) from test1 group by 1
select gnd,count(*) from test1 group by 1
select phone,gnd ,count(*) from test1 group by phone,gnd

select gnd,count() from test1 group by 1
500万数据执行时间2秒不到
在这里插入图片描述
select phone ,count(
) from test1 group by 1
500万数据执行时间5秒不到
在这里插入图片描述
select phone,gnd ,count(*) from test1 group by phone,gnd
500万数据执行时间5.1秒左右

总结

在普通数据库里500万数据使用group by统计确实比较慢,但在GreenPlum下测试觉的确实性能高

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/18447.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅谈一下:Java当中的构造方法

从前面的所学的知识,我们可以发现:实列化一个对象以后,如果要为这个对象的属性赋值,那么必须直接访问对象的属性或者调用setXxx()方法,如果需要在实列化对象的同时就为这个对象的属性进行赋值,可以通过构造…

【考研复试】计算机专业考研复试英语常见问题四(优缺点/观点/观念篇)

相关链接: 【考研复试】计算机专业考研复试英语常见问题一(家庭/家乡/学校篇)【考研复试】计算机专业考研复试英语常见问题二(研究方向/前沿技术/本科毕设篇)【考研复试】计算机专业考研复试英语常见问题三&#xff0…

程序员这个身份,比你想象的还值钱!

看到这个标题先别急着喷我! 虽然现在“程序员”已经被吐槽饱和了,但目前小厂依旧求贤若渴,大厂一些门槛比较高的算法岗还是抛出了不少HC! 并且年年薪水涨,年年新人倒挂,校招白菜总包薪资近40w的不在少数&am…

从入门到项目实战 - vue2 与 vue3 中实现全局事件总线

VUE组件跨通信vue2 与 vue3 中实现全局事件总线上一节:《Vue中的 虚拟 Dom 》| 下一节:《Vue 组件常见的数据访问方式总结 》jcLee95 邮箱 :291148484163.com CSDN 主页:https://blog.csdn.net/qq_28550263?spm1001.2101.300…

【物理应用】基于Matlab模拟极化雷达回波

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

服务器安装Ubuntu20及系统扩容

文章首发及后续更新:https://mwhls.top/4060.html,无图/无目录/格式错误/更多相关请至首发页查看。 新的更新内容请到mwhls.top查看。 欢迎提出任何疑问及批评,非常感谢! 参考:Ubuntu20.04安装详细图文教程&#xff08…

C++初阶作业 String类作业详解

作者:小萌新 专栏:C初阶作业 作者简介:大二学生 希望能和大家一起进步! 本篇博客简介:会梳理一遍博主做过了String类题目 并且较为详细的讲解出来 _ String类的特性和使用 题目一 考察c_str()…

黑塞矩阵理解

文章目录1:一元泰勒展开公式2:二元泰勒展开公式3:二元函数的黑塞矩阵4:多元函数的黑塞矩阵其他链接1:一元泰勒展开公式 举例:f(x) 3x 2x 5 在x0或x1处的泰勒展开 当x0时: 当x1时&#xff…

m基于MATLAB的上行链路MIMO关键技术的研究与性能分析

目录 1.算法概述 2.仿真效果预览 3.MATLAB部分代码预览 4.完整MATLAB程序 1.算法概述 多输入多输出(MIMO)天线技术的巨大潜力为新一代无线通信技术的研究提供了广阔的舞台。近年来,多用户的MIMO研究逐渐成为热点问题。针对多用户的MIMO,天线选择和用…

Allegro如何输出EMN文件操作指导

Allegro如何输出EMN文件操作指导 Allegro支持输出emn文件以供其他结构软件导入以查看实物效果 比如Proe,Soild work等等 下面介绍如何输出EMN文件 选择 File-export-IDF 出现一个对话框 File Name Type选择PTC,并且勾选Use Fillter 点击Fillter, 过滤掉不需要的东西,比…

快速排序、求和、模拟阶乘并利用vscode c++和matlab对程序进行计时

一、软件性能获取 分别使用 Matlab 工具和C语言获得计算下列算法的最大时间,最小时间及平均时间,以及相应的软件功耗: 1.1 一维数组排序 数组选择一万个,使用快速排序。处理器为英特尔i5-7200U,2.5GHz,热设计功耗为…

智慧水务解决方案-最新全套文件

智慧水务解决方案-最新全套文件一、建设背景1、安全水务,监管提效2、清洁水务,防污治污3、节能水务,降本增效4、民生水务,体验先行二、建设思路三、建设方案四、获取 - 智慧水务全套最新解决方案合集一、建设背景 建设智慧水务的…

Dubbo入门使用

Dubbo入门案例Dubbo的特性dubbo支持的注册中心Dubbo入门案例Dubbo的特性 服务治理框架服务的监控服务的注册发现服务的通信服务的容错服务的负载均衡 dubbo支持的注册中心 nacosconsolezookeeperrediseurekaetcd …… Dubbo入门案例 通过两个demo来演示如何使用dubbo进行R…

【Java基础】Java基础题

1. 重载和重写的区别 1)重载: 发生在同一个类中,要求方法名相同、参数类型不同(个数不同、顺序不同、类型不同) 和方法的返回值和访问修饰符没关系(在只有返回值和访问修饰符不同的这种情况下&#xff0c…

Linux--进程控制

目录 进程创建 fork函数初识 fork函数返回值 写时拷贝 fork的常规用法 fork调用失败的原因 进程终止 进程退出场景 退出方法 ①调用_exit函数 ②调用exit函数 ③main函数return ④异常退出 进程等待 进程等待的必要性 进程等待的方法 ①wait方法 ②waitpid方…

常用的路径规划算法浅析

路径规划 所谓路径规划,也就是在起点和终点之间找到一条连续的运动轨迹,在尽可能优化路径的同时避开环境中的障碍物。 常用的路径规划算法有传统的基于图搜索算法、基于采样的路径规划算法,以及考虑动力学的路径规划算法等。那么&#xff0…

位于kernel的文件系统大管家--Virtual File System

一、全局视角:VFS 的任务 VFS 作为中间适配层,他需要招呼 3 个大佬:1. 应用进程 ,2.系统内核 3.底层磁盘。 二、VFS负责处理 3 个任务的核心接口 1. VFS 提供给 【应用进程 】的接口: 进程的 “办公地点” – struct fs_struc…

【C】—文件版本通讯录的实现

关于C语言的知识放在专栏:C 小菜坤日常上传gitee代码:https://gitee.com/qi-dunyan ❤❤❤ 个人简介:双一流非科班的一名小白,期待与各位大佬一起努力! 目录思路代码实现完整代码(可自取)思路 …

【SQL】索引的创建与设计原则

【SQL】索引的创建与设计原则索引的声明与使用索引的创建删除索引索引设计原则数据准备:哪些情况适合创建索引不适合创建索引的情况索引的声明与使用 索引的创建 # 索引的创建 #法1:create table # 隐式方式创建索引.在声明有主键约束、唯一性约束、外键约束的字段…

java项目-第146期ssm人事工资管理系统(spring+springmvc+mybatis+jsp)_java毕业设计_计算机毕业设计

java项目-第146期ssm人事工资管理系统(springspringmvcmybatisjsp)_java毕业设计_计算机毕业设计 【源码请到资源专栏下载】 今天分享的项目是《ssm人事工资管理系统》 该项目分为2个角色,管理员和用户。 用户可以浏览前台,包含功能有: 个人中心、公告信…