故障
worker3故障重启后,该节点的 pod 访问不了其它节点服务
2023-06-26T07:44:41.041Z ERROR setup unable to start manager {"error": "Get \"https://10.244.64.1:443/api?timeout=32s\": dial tcp 10.244.64.1:443: i/o timeout"}
发现网络组件也是有报错重启,对比其它节点的iptables,少了好多。


该节点 calico-node 服务重启多次,最后的日志显示 Shutting down
开始准备清理 iptables -F 了。。。
想想,还是试试重启该网络节点服务吧
kubectl delete pod -n kube-system calico-node-hqb6b

居然恢复了。哈哈
















![[算法前沿]--028-基于Hugging Face -Transformers的预训练模型微调](https://img-blog.csdnimg.cn/3ba51fe4f21d4d528ca7b0f2fd78aee4.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA56We5rSb5Y2O,size_20,color_FFFFFF,t_70,g_se,x_16#pic_center)


