1.案例
k8s的master组件出错,删掉pod重新拉起也无法正常启动
kubectl get pod -n kube-system

可以看到controller和scheduler组件都显示异常
kubectl describe pod kube-apiserver-k8s-master03 -n kube-system

通过describe查看组件容器的详细信息也并没有报错输出
kubectl delete pod kube-controller-manager-k8s-master02 -n kube-system
kubectl get pod -n kube-system

可以看到即使删除了pod,pod也没重新拉起,依然是老的pod显示报错
2.解决方法
修改一下组件的yaml文件中无关紧要的参数,使组件的pod自动重启
vi /etc/kubernetes/manifests/kube-scheduler.yaml
vi /etc/kubernetes/manifests/kube-controller-manager.yaml
更改两个yaml文件中的livenessProbe的超时时间
timeoutSeconds: 16 #将15秒改成16秒,保存退出即可
kubectl get pod -n kube-system

就可以看到重新拉起了一个新的组件pod











![[细读经典]Megatron论文和代码详细分析(1)](https://img-blog.csdnimg.cn/img_convert/e5416f4bb57da4e6faef3c49201c94fe.webp?x-oss-process=image/format,png)







