优维运营治理三件套:可用性x性能x容量管理

news2025/6/25 20:01:00

对于系统/应用运维人员,日常工作中需要保证系统/应用的可用性、稳定性和关注系统/应用的性能表现。为了帮助IT人员更好地管理和优化企业的系统和应用,我们引入了三大关键能力:可用性管理、性能管理和容量管理。这些能力不仅能够帮助IT人员发现问题,还能提供丰富的数据和分析,以支持日常运维决策。让我们一起探索这些能力,提升企业IT人员的运维效率,保障系统稳定性和性能表现!

可用性管理

服务水平目标(SLO)指定了服务可靠性的目标水平。由于SLO是做出以数据为依据的可靠性决策的关键,因此它们是SRE实践的核心。

SLO是可靠性决策的关键因素,它的存在价值是:及时报警,发现影响SLI指标的异常。并且,产生的SLO告警是SRE和研发共同关注的告警信息。它的根本目标是持续性提高产品质量,缩短故障处理时长,保证平台的可靠性。

因此,实践SRE工程的第一步是计算出正确的可用性是多少,以此定量出实际的服务可靠性水平离SLO到底有多远。

我们期望能看到每个业务线,包括基础设施的周可用性、月可用性和年可用性,并且和年度目标的差距有多少。

图片

配置

可用性管理的配置对象时服务,因此,我们可以打开可用性管理微应用,进入设置功能:进入特定的应用系统,选择核心服务,并且设置SLO值。

图片

每个服务都需要关联一个拨测任务,以detect_code为考核指标,计算此服务的可用性分数:

图片

性能管理

在当今数字化时代,用户体验往往是企业成功的关键。随着用户对应用性能的期望不断提高,优化应用性能已成为企业提升用户满意度和保持竞争力的重要举措。性能管理小产品,提供系统/应用的性能管理视图,以CMDB系统/应用树来呈现性能状态,帮助IT人员全面了解和优化系统性能,从而提升用户满意度和忠诚度。

特性介绍

  1. Apdex标准引入:不同应用系统的特征不同,对性能的要求也不一样。企业往往缺乏统一的系统性能评估手段,导致性能认知及系统建设方法不统一。为此,我们引入Apdex标准,构建面向系统/应用服务的统一标准的性能评估体系。

  2. 系统/应用性能排行看板:提供了系统/应用两个维度的性能排行看板,不仅可以快速察觉性能瓶颈所在系统/应用,也能保证性能问题可进一步排查。从业务到技术,从全局(系统级别)到局部(接口级别),层层分析定位,最终有效定位性能木桶短板。

  3. 全面的性能分析:我们的性能管理系统不仅提供简单的性能数据,还能提供深度的性能分析。通过性能指标和trace数据的综合分析,帮助企业发现系统性能的各个方面,从而为性能优化提供更全面的参考。

  4. 实时监控与预警:结合告警事件中心和服务可观测的能力,我们的系统能够实时监控系统/应用的性能指标,并支持设定相应的告警规则。一旦系统性能出现异常,将立即告警,以便及时采取措施解决问题,保障应用的稳定性和性能体验。

图片

图片

如何配置

点击进入「Apdex配置」页面,按如下步骤进行配置

图片

Apdex计算规则如下图,配置页面内也有规则详细介绍,可随时点击查看。

图片

容量管理

IT部门面临着越来越复杂的业务场景困难和挑战,这些都将最终需要转换为IT资源的支撑,因而对IT资源的需求和规划愈发重要。此时容量管理就起到了关键的作用,帮助识别资源瓶颈与富余情况,为IT技术负责人统一的IT资源业务支撑评估规划及成本评估与控制等活动提供有力依据。

特性介绍

  1. 以系统视角立体化容量评估:平台提供系统及服务视角组建的容量视图,符合IT部门惯常的组织和维护方式,系统级别颗粒度能较为全面了解资源情况,服务级别则提供更精细运维管理维度定位具体容量问题。

  2. 高负载和低负载容量配置:在容量分析维度中,不仅需要洞悉可能影响业务运行的高负载容量情况,也需要了解不符合经济效益的低负载容量情况,因而平台提供对服务设置高低负载阈值,因而也可以在系统级别分析中分别以最低和最高的服务负载汇聚为系统的最小和最大容量指标。

  3. 结合性能评分做容量分析:权衡资源容量是否满足业务需求,除了看资源的绝对占用容量,还要综合性能评分进行综合评估,因而平台将与【性能管理】能力串联,提供性能评分综合进行容量评估。

图片

如何配置

① 进入【服务容量配置】可管理纳入容量计算的系统。

图片

② 添加系统后可配置纳入计算的服务范围。

图片

③ 针对不同的服务,可为主机/容量类型的服务配置纳入容量计算的指标和阈值。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1822908.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

图解系列 图解Kafka之Consumer

文章目录 术语消息主题和分区集群和分区副本消费者组重新平衡组/分区再均衡消费者的分区策略群组协调者Coordinator 和群组领导者 Group Leader 流程初始化流程消费流程Consumer重平衡 消费者核心配置示例代码高级提交偏移量的几种方式自动提交手动同步提交手动异步提交提交特定…

Python深度学习基于Tensorflow(16)基于Transformer的对话实例

文章目录 基础数据清洗数据生成词汇表定义分词器并制作数据集构建Transformer模型并训练模型推理 Tensorflow 的核心就是注意力机制,在之前详细的介绍过,具体可以看这个:Python深度学习基于Tensorflow(9)注意力机制_te…

解决浏览器缩放的时候,重新设置滚动条的位置,使页面滚动条固定悬浮在页面底部

项目场景: 浏览器调试页面兼容页面时,缩放页面宽度,整体超出时滚动条出现在页面最底部,不是悬浮在页面下面,只有滚动到最底部才出现,需要的是悬浮在页面底部,不是滚动到最下面才出现 解决方案…

二维数组的遍历

旋转图像 class Solution {public void rotate(int[][] matrix) {for(int i0;i<matrix.length;i){for(int ji1;j<matrix[0].length;j){int tempmatrix[i][j];matrix[i][j]matrix[j][i];matrix[j][i]temp;}}for(int[] arr:matrix){reverse(arr);}}void reverse(int[] arr)…

Ant-design-vue开源项目介绍、应用场景、组件有哪些

文章目录 一、Ant-design-vue项目介绍二、Ant-design-vue项目特点三、Ant-design-vue应用场景四、Ant-design-vue有哪些组件五、Ant-design-vue案例代码1. 后台管理系统登录页面的例子2. Table组件使用案例 开源项目地址 一、Ant-design-vue项目介绍 Ant-design-vue 是一个基于…

java面试题:springMVC的执行流程

请求到达前端控制器DispatcherServlet&#xff0c;该组件是SpringMVC的核心组件&#xff0c;负责接收所有的请求。 DispatcherServlet根据请求中的URL和HandlerMapping找到对应的Controller对象&#xff0c;HandlerMapping是一个接口&#xff0c;定义了请求的URL和对应的Contro…

刺客信条找不到emp.dll怎么解决?emp.dll缺失的解决方法解析

emp.dll 是一个动态链接库文件&#xff0c;它在Windows操作系统中扮演着重要的角色。这个文件包含了多个函数和接口&#xff0c;允许其他程序调用这些功能来实现对多媒体设备的控制和管理。根据搜索结果&#xff0c;emp.dll 主要负责以下功能&#xff1a; 多媒体设备管理&…

进阶篇03——SQL优化

insert 优化 主键优化 不好做笔记&#xff0c;但是挺重要的&#xff0c;留个视频链接&#xff1a;主键优化 order by 优化 视频链接&#xff1a;order by 优化 group by 优化 放视频&#xff08;好吧&#xff0c;这篇文章感觉还是看视频容易懂一点&#xff09;&#xff1a;…

一文了解JVM(中)

HotSpot 虚拟机对象探秘 对象的创建 Header解释使用 new 关键字调用了构造函数使用 Class 的 newInstance 方法调用了构造函数使用 Constructor 类的newInstance 方法调用了构造函数使用 clone 方法没有调用构造函数使用反序列化没有调用构造函数说到对象的创建,首先让我们看…

45.Python-web框架-Django - 开始建立第一个项目

目录 1.django是什么&#xff1f; 2.Pycharm 社区版&#xff0c;还是专业版&#xff1f; 3.开始django&#xff0c;Pycharm专业版 创建一个Django项目 运行一个Django项目 运行方法一&#xff0c;命令行的方式 运行方法二&#xff0c;配置Django Server的方式 4.django尊…

编译原理:语法分析之LR分析

自底向上分析方法&#xff08;LR分析算法&#xff09;bottom-up parsing 引言. 运算符 LR(0)LR(0)的项&#xff08;构建有穷自动机的状态&#xff09;LR(0)的项目闭包&#xff08;构建有穷自动机的状态&#xff09;GOTO函数有效项目LR(0)有穷自动机的构建 SLRLR(1)LALR 引言 L…

树莓派4B学习笔记7:(Python)_TTL串口收发数据_

今日继续学习树莓派4B 4G&#xff1a;&#xff08;Raspberry Pi&#xff0c;简称RPi或RasPi&#xff09; 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1&#xff1a; 今日尝试使用树莓派的TTL串口进行收发数据&#xff1a; …

Web应用安全测试-业务功能滥用(二)

Web应用安全测试-业务功能滥用&#xff08;二&#xff09; 7、未验证的URL跳转 漏洞描述&#xff1a;服务端未对传入的跳转url变量进行检查和控制&#xff0c;可能导致可恶意构造任意一个恶意地址&#xff0c;诱导用户跳转到恶意网站。由于是从可信的站点跳转出去的&#xff…

无线MODBUS通讯模块在供水系统中的应用

一、项目背景 我国是人口大国、农业大国&#xff0c;同时也是贫水大国。由于大量工业废水污染了部分河流、地表的浅层水资源&#xff0c;并且有逐年加重的趋势&#xff0c;再加上农业、绿化等灌溉对水资源的大量消耗&#xff0c;这些因素综合作用进一步加剧了我国水资源紧缺的…

计算机网络:网络层 - IPv6

计算机网络&#xff1a;网络层 - IPv6 IPv6 数据报IPv6 地址冒号十六进制记法地址分类 IPv4 到 IPv6 过渡双栈协议隧道技术 IPv6 是互联网协议的最新版本&#xff0c;它被设计用来取代现有的 IPv4 协议。这是因为 IPv4 存在一些根本性的限制&#xff0c;而 IPv6 则可以解决这些…

Burp Suite使用及BruteForc_test靶场实战

简介 Burp Suite是用于攻击和测试Web应用程序安全性的集成平台&#xff0c;包含多个协同工作的工具&#xff0c;支持信息共享与复杂攻击。设计有加速攻击流程的接口&#xff0c;所有工具共享强大框架&#xff0c;处理HTTP消息、持久性、认证、代理、日志和警报。主要用于安全性…

【数据结构】【版本1.1】【线性时代】——单链表

快乐的流畅&#xff1a;个人主页 个人专栏&#xff1a;《算法神殿》《数据结构世界》《进击的C》 远方有一堆篝火&#xff0c;在为久候之人燃烧&#xff01; 文章目录 引言一、顺序表的问题二、链表的概念三、单链表的模拟实现3.1 定义3.2 打印3.3 创建新节点3.4 头插3.5 尾插3…

2-3 基于matlab的NSCT-PCNN融合和创新算法(NSCT-ML-PCNN )图像融合

基于matlab的NSCT-PCNN融合和创新算法&#xff08;NSCT-ML-PCNN &#xff09;图像融合。NSSCTest.m文件&#xff1a;用于查看利用NSSC算法分解出的图像并保存。其中的nlevel可调test.m文件&#xff1a;用于产生融合结果&#xff0c;其中一个参数需要设置&#xff1a;Low_Coeffs…

DTU在城市智慧供热上的应用:引领供热行业的智能化革新

随着城市化的快速推进和人们对舒适生活需求的日益增长&#xff0c;供热系统作为城市基础设施的重要组成部分&#xff0c;其智能化、高效化的发展已成为必然趋势。在这一进程中&#xff0c;DTU&#xff08;Data Transfer Unit&#xff0c;数据传输单元&#xff09;以其独特的优势…

Java 反射机制 -- Java 语言反射的概述、核心类与高级应用

大家好,我是栗筝i,这篇文章是我的 “栗筝i 的 Java 技术栈” 专栏的第 010 篇文章,在 “栗筝i 的 Java 技术栈” 这个专栏中我会持续为大家更新 Java 技术相关全套技术栈内容。专栏的主要目标是已经有一定 Java 开发经验,并希望进一步完善自己对整个 Java 技术体系来充实自…