Kubernetes异常?别担心,100个命令来解救你

news2025/7/21 19:59:10

关注【云原生百宝箱】公众号,快速掌握云原生

这篇文章是关于使用 Kubectl 进行 Kubernetes 诊断的指南。作者列出了 100 个 Kubectl 命令,这些命令对于诊断 Kubernetes 集群中的问题非常有用。这些问题包括但不限于:

  • 集群信息
  • Pod 诊断
  • 服务诊断
  • 部署诊断
  • 网络诊断
  • 持久卷和持久卷声明诊断
  • 资源使用情况
  • 安全和授权
  • 节点故障排除
  • 其他诊断命令:文章还提到了许多其他命令,如资源扩展和自动扩展、作业和定时作业诊断、Pod 亲和性和反亲和性规则、RBAC 和安全、服务账号诊断、节点排空和取消排空、资源清理等。

集群信息:
请添加图片描述

  1. 显示 Kubernetes 版本:kubectl version
  2. 显示集群信息:kubectl cluster-info
  3. 列出集群中的所有节点:kubectl get nodes
  4. 查看一个具体的节点详情:kubectl describe node <node-name>
  5. 列出所有命名空间:kubectl get namespaces
  6. 列出所有命名空间中的所有 pod:kubectl get pods --all-namespaces

Pod 诊断:

  1. 列出特定命名空间中的 pod:kubectl get pods -n <namespace>
  2. 查看一个 Pod 详情:kubectl describe pod <pod-name> -n <namespace>
  3. 查看 Pod 日志:kubectl logs <pod-name> -n <namespace>
  4. 尾部 Pod 日志:kubectl logs -f <pod-name> -n <namespace>
  5. 在 pod 中执行命令:kubectl exec -it <pod-name> -n <namespace> -- <command>

Pod 健康检查:

  1. 检查 Pod 准备情况:kubectl get pods <pod-name> -n <namespace> -o jsonpath='{.status.conditions[?(@.type=="Ready")].status}'
  2. 检查 Pod 事件:kubectl get events -n <namespace> --field-selector involvedObject.name=<pod-name>

Service诊断:

  1. 列出命名空间中的所有服务:kubectl get svc -n <namespace>
  2. 查看一个服务详情:kubectl describe svc <service-name> -n <namespace>

Deployment诊断:

  1. 列出命名空间中的所有Deployment:kubectl get deployments -n <namespace>
  2. 查看一个Deployment详情:kubectl describe deployment <deployment-name> -n <namespace>
  3. 查看滚动发布状态:kubectl rollout status deployment/<deployment-name> -n <namespace>
  4. 查看滚动发布历史记录:kubectl rollout history deployment/<deployment-name> -n <namespace>

StatefulSet诊断:

  1. 列出命名空间中的所有 StatefulSet:kubectl get statefulsets -n <namespace>
  2. 查看一个 StatefulSet详情:kubectl describe statefulset <statefulset-name> -n <namespace>

ConfigMap 和Secret诊断:

  1. 列出命名空间中的 ConfigMap:kubectl get configmaps -n <namespace>
  2. 查看一个ConfigMap详情:kubectl describe configmap <configmap-name> -n <namespace>
  3. 列出命名空间中的 Secret:kubectl get secrets -n <namespace>
  4. 查看一个Secret详情:kubectl describe secret <secret-name> -n <namespace>

命名空间诊断:

  1. 查看一个命名空间详情:kubectl describe namespace <namespace-name>

资源使用情况:

  1. 检查 pod 的资源使用情况:kubectl top pod <pod-name> -n <namespace>
  2. 检查节点资源使用情况:kubectl top nodes

网络诊断:

  1. 显示命名空间中 Pod 的 IP 地址:kubectl get pods -n <namespace> -o custom-columns=POD:metadata.name,IP:status.podIP --no-headers
  2. 列出命名空间中的所有网络策略:kubectl get networkpolicies -n <namespace>
  3. 查看一个网络策略详情:kubectl describe networkpolicy <network-policy-name> -n <namespace>

持久卷 (PV) 和持久卷声明 (PVC) 诊断:

  1. 列出PV:kubectl get pv
  2. 查看一个PV详情:kubectl describe pv <pv-name>
  3. 列出命名空间中的 PVC:kubectl get pvc -n <namespace>
  4. 查看PVC详情:kubectl describe pvc <pvc-name> -n <namespace>

节点诊断:
请添加图片描述

  1. 获取特定节点上运行的 Pod 列表:kubectl get pods --field-selector spec.nodeName=<node-name> -n <namespace>

资源配额和限制:

  1. 列出命名空间中的资源配额:kubectl get resourcequotas -n <namespace>
  2. 查看一个资源配额详情:kubectl describe resourcequota <resource-quota-name> -n <namespace>

自定义资源定义 (CRD) 诊断:

  1. 列出命名空间中的自定义资源:kubectl get <custom-resource-name> -n <namespace>
  2. 查看自定义资源详情:kubectl describe <custom-resource-name> <custom-resource-instance-name> -n <namespace>

使用这些命令时,请记住将<namespace>, <pod-name>, <service-name>, <deployment-name>, <statefulset-name>, <configmap-name>, <secret-name>, <namespace-name>, <pv-name>, <pvc-name>, <node-name>, <network-policy-name>, <resource-quota-name>, <custom-resource-name>, 和替换为你的特定值。

<custom-resource-instance-name>这些命令应该可以帮助你诊断 Kubernetes 集群以及在其中运行的应用程序。

资源伸缩和自动伸缩

  1. Deployment伸缩:kubectl scale deployment <deployment-name> --replicas=<replica-count> -n <namespace>
  2. 设置Deployment的自动伸缩:kubectl autoscale deployment <deployment-name> --min=<min-pods> --max=<max-pods> --cpu-percent=<cpu-percent> -n <namespace>
  3. 检查水平伸缩器状态:kubectl get hpa -n <namespace>

作业和 CronJob 诊断:

  1. 列出命名空间中的所有作业:kubectl get jobs -n <namespace>
  2. 查看一份工作详情:kubectl describe job <job-name> -n <namespace>
  3. 列出命名空间中的所有 cron 作业:kubectl get cronjobs -n <namespace>
  4. 查看一个 cron 作业详情:kubectl describe cronjob <cronjob-name> -n <namespace>

容量诊断:

  1. 列出按容量排序的持久卷 (PV):kubectl get pv --sort-by=.spec.capacity.storage
  2. 查看PV回收策略:kubectl get pv <pv-name> -o=jsonpath='{.spec.persistentVolumeReclaimPolicy}'
  3. 列出所有存储类别:kubectl get storageclasses

Ingress和服务网格诊断:
在这里插入图片描述

  1. 列出命名空间中的所有Ingress:kubectl get ingress -n <namespace>
  2. 查看一个Ingress详情:kubectl describe ingress <ingress-name> -n <namespace>
  3. 列出命名空间中的所有 VirtualServices (Istio):kubectl get virtualservices -n <namespace>
  4. 查看一个 VirtualService (Istio)详情:kubectl describe virtualservice <virtualservice-name> -n <namespace>

Pod 网络故障排除:

  1. 运行网络诊断 Pod(例如 busybox)进行调试:kubectl run -it --rm --restart=Never --image=busybox net-debug-pod -- /bin/sh
  2. 测试从 Pod 到特定端点的连接:kubectl exec -it <pod-name> -n <namespace> -- curl <endpoint-url>
  3. 跟踪从一个 Pod 到另一个 Pod 的网络路径:kubectl exec -it <source-pod-name> -n <namespace> -- traceroute <destination-pod-ip>
  4. 检查 Pod 的 DNS 解析:kubectl exec -it <pod-name> -n <namespace> -- nslookup <domain-name>

配置和资源验证:

  1. 验证 Kubernetes YAML 文件而不应用它:kubectl apply --dry-run=client -f <yaml-file>
  2. 验证 pod 的安全上下文和功能:kubectl auth can-i list pods --as=system:serviceaccount:<namespace>:<serviceaccount-name>

RBAC 和安全性:

  1. 列出命名空间中的角色和角色绑定:kubectl get roles,rolebindings -n <namespace>
  2. 查看角色或角色绑定详情:kubectl describe role <role-name> -n <namespace>

服务帐户诊断:

  1. 列出命名空间中的服务帐户:kubectl get serviceaccounts -n <namespace>
  2. 查看一个服务帐户详情:kubectl describe serviceaccount <serviceaccount-name> -n <namespace>

清空节点和解除封锁:

  1. 清空节点以进行维护:kubectl drain <node-name> --ignore-daemonsets
  2. 解除对节点的封锁:kubectl uncordon <node-name>

资源清理:

  1. 强制删除 pod(不推荐):kubectl delete pod <pod-name> -n <namespace> --grace-period=0 --force

Pod 亲和性和反亲和性:

  1. 列出 pod 的 pod 亲和性规则:kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.affinity}'
  2. 列出 pod 的 pod 反亲和性规则:kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.affinity.podAntiAffinity}'

Pod 安全策略 (PSP):

  1. 列出所有 Pod 安全策略(如果启用):kubectl get psp

事件:

  1. 查看最近的集群事件:kubectl get events --sort-by=.metadata.creationTimestamp
  2. 按特定命名空间过滤事件:kubectl get events -n <namespace>

节点故障排除:

  1. 检查节点情况:kubectl describe node <node-name> | grep Conditions -A5
  2. 列出节点容量和可分配资源:kubectl describe node <node-name> | grep -E "Capacity|Allocatable"

临时容器(Kubernetes 1.18+):

  1. 运行临时调试容器:kubectl debug -it <pod-name> -n <namespace> --image=<debug-image> -- /bin/sh

资源指标(需要指标服务器):

  1. 获取 Pod 的 CPU 和内存使用情况:kubectl top pod -n <namespace>

kuelet诊断:

  1. 查看节点上的kubelet日志:kubectl logs -n kube-system kubelet-<node-name>

使用Telepresence 进行高级调试:

  1. 使用 Telepresence 调试 pod:telepresence --namespace <namespace> --swap-deployment <pod-name>

Kubeconfig 和上下文:

  1. 列出可用的上下文:kubectl config get-contexts
  2. 切换到不同的上下文:kubectl config use-context <context-name>

Pod 安全标准(PodSecurity 准入控制器):

  1. 列出 PodSecurityPolicy (PSP) 违规行为:kubectl get psp -A | grep -vE 'NAME|REVIEWED'

Pod 中断预算 (PDB) 诊断:

  1. 列出命名空间中的所有 PDB:kubectl get pdb -n <namespace>
  2. 查看一个PDB详情:kubectl describe pdb <pdb-name> -n <namespace>

资源锁诊断(如果使用资源锁):

  1. 列出命名空间中的资源锁:kubectl get resourcelocks -n <namespace>

服务端点和 DNS:
在这里插入图片描述

  1. 列出服务的服务端点:kubectl get endpoints <service-name> -n <namespace>
  2. 检查 Pod 中的 DNS 配置:kubectl exec -it <pod-name> -n <namespace> -- cat /etc/resolv.conf

自定义指标(Prometheus、Grafana):

  1. 查询Prometheus指标:用于kubectl port-forward访问Prometheus和Grafana服务来查询自定义指标。

Pod 优先级和抢占:

  1. 列出优先级:kubectl get priorityclasses

Pod 开销(Kubernetes 1.18+):

  1. 列出 pod 中的开销:kubectl get pod <pod-name> -n <namespace> -o=jsonpath='{.spec.overhead}'

存储卷快照诊断(如果使用存储卷快照):

  1. 列出存储卷快照:kubectl get volumesnapshot -n <namespace>
  2. 查看存储卷快照详情:kubectl describe volumesnapshot <snapshot-name> -n <namespace>

资源反序列化诊断:

  1. 反序列化并打印 Kubernetes 资源:kubectl get <resource-type> <resource-name> -n <namespace> -o=json

节点污点:

  1. 列出节点污点:kubectl describe node <node-name> | grep Taints

更改和验证 Webhook 配置:

  1. 列出变异 webhook 配置:kubectl get mutatingwebhookconfigurations
  2. 列出验证 Webhook 配置:kubectl get validatingwebhookconfigurations

Pod 网络策略:

  1. 列出命名空间中的 pod 网络策略:kubectl get networkpolicies -n <namespace>

节点条件(Kubernetes 1.17+):

  1. 自定义查询输出:kubectl get nodes -o custom-columns=NODE:.metadata.name,READY:.status.conditions[?(@.type=="Ready")].status -l 'node-role.kubernetes.io/worker='

审核日志:

  1. 检索审核日志(如果启用):检查 Kubernetes 审核日志配置以了解审核日志的位置。

节点操作系统详细信息:

  1. 获取节点的操作系统信息:kubectl get node <node-name> -o jsonpath='{.status.nodeInfo.osImage}'

这些命令应该涵盖 Kubernetes 中的各种诊断场景。确保将<namespace><pod-name><deployment-name>等占位符替换为你的集群和用例的实际值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1157160.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一款成熟的文件外发审计管控系统,应该具备哪些价值?

在信息化高速发展的时代&#xff0c;电子文件泄密事件层出不穷&#xff0c;比如文本文档、图像、音频、视频、电子表格等&#xff0c;都是日常会接触到的文件类型。像制造业企业&#xff0c;会有比较多的上下游协作交流&#xff0c;外发的电子文档以明文的形式提供给合作伙伴&a…

信号类型(通信)——QAM调制信号

系列文章目录 《信号类型&#xff08;通信&#xff09;——仿真》 文章目录 前言 一、原理图 二、仿真 2.1、QAM仿真 2.2、不同滚降系数 2.3、不同M下QAM调制对比 总结 前言 本文主要结合仿真分析了QAM的信号处理过程&#xff0c;并简单分析了成型滤波器中的滚降系数对QA…

开源播放器GSYVideoPlayer的简单介绍及播放rtsp流的优化

开源播放器GSYVideoPlayer的简单介绍及播放rtsp流的优化 前言一、GSYVideoPlayer&#x1f525;&#x1f525;&#x1f525;是什么&#xff1f;二、简单使用1.First、在project下的build.gradle添加2.按需导入3. 常用代码 rtsp流的优化大功告成 总结 前言 本文介绍&#xff0c;…

Kafka - 监控工具 Kafka Eagle:实时洞察Kafka集群的利器

文章目录 引言Kafka Eagle简介Kafka Eagle的特点Kafka Eagle的优势使用Kafka Eagle的步骤结论 引言 在现代大数据架构中&#xff0c;Apache Kafka已成为一个不可或缺的组件&#xff0c;用于可靠地处理和传输大规模的数据流。然而&#xff0c;随着Kafka集群规模的不断增长&…

私募证券基金动态-23年9月报

成交量&#xff1a;9月日均7,197.15亿元 2023年9月A股两市日均成交7,197.15亿元&#xff0c;环比下降12.78%、同比下降1.38%&#xff0c;为近2年单月日均成交最低的月份。9月整体20个交易日&#xff0c;单日成交金额最高没有过万亿&#xff0c;单日最低破6000亿&#xff0c;仅…

博弈论学习笔记(2)——完全信息静态博弈

前言 这部分我们学习的是完全信息静态博弈&#xff0c;主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。 零、绪论 1、什么是博弈论 1&#xff09;博弈的定义 博弈论&#xff1a;研究决策主体的行为发生直接相互作用时候的决策…

蓝桥杯 (C++ 求和 等差数列 顺子日期 灌溉)

目录 1、求和 题目&#xff1a; 思路&#xff1a; 代码&#xff1a; 1、求和 题目&#xff1a; 思路&#xff1a; 1、首先想到的是两重遍历&#xff0c;累加和。但是当n取200000时&#xff0c;会超时&#xff0c;所以暴力的遍历没有办法通过全部案例。 2、将公式变形得到…

AI先行者第一辑:AI for Science 要坚持高压强投入

‍‍ 中国在AI for Science的基础还非常的薄弱&#xff0c;且非短期内可以提升&#xff0c;需要有一个长期性的计划&#xff0c;也需要有足够的金钱投入和人才队伍建设。 本篇作者褚学森&#xff0c;中国船舶科学研究中心、深海技术科学太湖实验室 研究员&#xff1b;新兴技术研…

代码随想录算法训练营第四十天丨 动态规划part03

343. 整数拆分 思路 看到这道题目&#xff0c;都会想拆成两个呢&#xff0c;还是三个呢&#xff0c;还是四个.... 来看一下如何使用动规来解决。 动态规划 动规五部曲&#xff0c;分析如下&#xff1a; 确定dp数组&#xff08;dp table&#xff09;以及下标的含义 dp[i]…

DNS 域名解析系统

文章目录 前言什么是 DNS 域名解析系统为什么需要 DNS 域名解析DNS 是如何发展的hosts 文件维护域名和IP的映射关系DNS 系统&#xff08;服务器&#xff09;DNS 镜像系统 前言 前面为大家分享了关于计算机网络中应用层——自定义协议、传输层——UDP、TCP 协议、网络层——IP协…

怎样用ps把人物皮肤磨皮,人物皮肤磨皮怎么办

品牌型号:联想GeekPro 2020 系统: Windows 10 64位专业版 软件版本: portraiture 3.5.6 皮肤瑕疵是人像拍摄中比较容易出现的问题&#xff0c;对于皮肤瑕疵后期一般会使用磨皮的方法处理。那么&#xff0c;怎样用ps把人物皮肤磨皮&#xff1f;ps磨皮的工具丰富多样&#xff…

如何在不同的系统中查找IP地址

知道如何找到你的IP地址是我们大多数人在日常生活中很少使用的技能&#xff0c;但当你需要的时候&#xff0c;这是一种你会感激的技能——尤其是如果你运行的是最好的Wi-Fi路由器之一。 当你从事家庭网络项目时&#xff0c;知道你的IP地址很重要&#xff0c;一旦你知道了基本知…

倾斜摄影三维模型数据几何坐标重建方法分析

倾斜摄影三维模型数据几何坐标重建方法分析 利用几何坐标变换等技术实现倾斜摄影三维模型数据的坐标重建&#xff0c;可以采用以下方法&#xff1a; 1、数据准备&#xff1a;首先&#xff0c;需要获取倾斜摄影影像数据。这些影像应包含多个视角下的拍摄图像&#xff0c;并覆盖…

docker--基本操作

第 1 章 Docker基础 1.1 docker简介 在这一部分我们主要讲两个方面&#xff1a; docker是什么、docker特点 1.1.1 docker是什么 docker是什么&#xff1f; docker的中文解释是码头工人。 官方解释&#xff1a; Docker是一个开源的容器引擎&#xff0c;它基于LCX容器技术&…

最新广告联盟系统源码/实时监控移动广告联盟系统/多元化合作推广方式+支持各种广告效果

源码简介&#xff1a; 最新广告联盟系统源码&#xff0c;作为实时监控移动广告联盟&#xff0c;它有着多元化合作推广方式&#xff0c;并支持各种广告效果。它是最新版本、功能强大的广告联盟系统。 诚丰广告联盟系统的单台服务器每天能够承受至少2000万个PV流量&#xff0c;并…

前端(二十六)——常见的HTTP异常状态码以及正反向代理配置

&#x1f475;博主&#xff1a;小猫娃来啦 &#x1f475;文章核心&#xff1a;前端常见的HTTP异常状态码以及正反向代理配置 文章目录 前端常见的HTTP异常状态码404 - 未找到资源403 - 禁止访问304 - 未修改500 - 服务器内部错误 正反向代理配置重要性本地正向代理配置服务器配…

GhostNet(CVPR 2020)学习笔记 (附代码)

论文地址&#xff1a;​​​​​​https://arxiv.org/abs/1911.11907v2 代码地址&#xff1a;https://github.com/huawei-noah/Efficient-AI-Backbones/blob/master/ghostnet_pytorch/ghostnet.py 1.是什么&#xff1f; Ghost module是一种模型压缩的方法&#xff0c;它可以…

韦东山D1S板子——利用xfel工具初始化内置64MB内存,并直接下载程序到内存运行

1、前言 &#xff08;1&#xff09;最近使用韦东山老师的D1S板子学习RISC-V架构知识&#xff0c;我是结合《RISC-V体系结构编程与实践》这本书的进行学习&#xff0c;其中韦东山老师对书中的代码做了部分移植&#xff0c;到MMU模块就没有在移植书中代码&#xff1b; &#xff0…

从小白到大牛:Linux嵌入式系统开发的完整指南

Linux嵌入式系统开发一直是一个激动人心的领域&#xff0c;吸引着越来越多的开发者。无论你是初学者还是已经有一些经验的开发者&#xff0c;本文将为你提供从小白到大牛的完整指南&#xff0c;帮助你掌握Linux嵌入式系统开发的关键概念和技能。我们将深入探讨Linux内核、设备驱…

从开发者的角度看K8S中的复合容器模式

就应用设计最佳实践和原则而言&#xff0c;构建复杂的基于容器的架构与编程没有太大区别。本文的目标是使用众所周知的编程原理从开发人员的角度展示三种流行的可扩展性架构模式。 让我们从单一职责原则开始。根据 R. Martin 的说法&#xff0c;“一个类应该只有一个改变的理由…