Kubernetes 故障排查命令大全:从诊断到修复
Kubernetes 作为容器编排的事实标准,在生产环境中的故障排查能力是运维和开发人员的核心技能。本文基于 Kubernetes 官方文档和实战经验,整理了一套完整的故障排查命令手册,涵盖集群、Pod、网络、存储、节点等各类故障场景。
一、快速诊断命令
1.1 集群整体状态
输出示例:
1.2 命名空间资源概览
1.3 事件查看
1.4 故障定位流程
kubectl get nodes→ 检查节点状态kubectl get pods→ 检查 Pod 状态kubectl describe→ 查看详细事件kubectl logs→ 查看容器日志kubectl exec→ 进入容器排查
二、Pod 故障排查
2.1 Pod 状态检查
2.2 Pod 状态说明
| 状态 | 说明 | 常见原因 |
|---|---|---|
Pending |
等待调度 | 资源不足、节点选择器不匹配 |
Running |
正在运行 | 正常状态 |
Completed |
执行完成 | Job 正常结束 |
Failed |
执行失败 | 容器异常退出 |
CrashLoopBackOff |
反复重启 | 应用启动失败、配置错误 |
ImagePullBackOff |
镜像拉取失败 | 镜像不存在、认证失败 |
ErrImagePull |
镜像拉取错误 | 镜像名称错误、网络问题 |
ContainerCreating |
容器创建中 | 镜像拉取慢、存储挂载慢 |
2.3 Pod 无法启动排查
步骤 1:查看 Pod 详情
步骤 2:查看容器日志
步骤 3:进入容器排查
2.4 CrashLoopBackOff 排查
常见退出码:
0:正常退出1:应用错误137:OOMKilled(内存超限)143:SIGTERM(优雅终止)
2.5 ImagePullBackOff 排查
三、Deployment 故障排查
3.1 Deployment 状态检查
3.2 Deployment 无法更新
3.3 Pod 无法达到期望副本数
四、Service 和网络故障排查
4.1 Service 状态检查
4.2 Service 无法访问
4.3 Ingress 故障排查
4.4 网络策略检查
五、节点故障排查
5.1 节点状态检查
5.2 节点 NotReady 排查
5.3 节点维护操作
六、存储故障排查
6.1 PV/PVC 状态检查
6.2 PVC Pending 排查
6.3 卷挂载失败
七、ConfigMap 和 Secret 排查
7.1 查看配置
7.2 配置未生效排查
八、资源限制排查
8.1 OOMKilled 排查
8.2 CPU 限制排查
九、日志和监控
9.1 组件日志
9.2 使用 kubectl debug
十、常用修复命令
10.1 Pod 修复
10.2 配置修复
10.3 紧急处理
十一、故障排查流程图
11.1 Pod 故障排查流程
kubectl get pods→ 查看 Pod 状态kubectl describe pod→ 查看事件和详情- 根据状态码判断问题类型
kubectl logs→ 查看应用日志kubectl exec→ 进入容器排查- 修复配置或重新部署
11.2 故障分级
| 级别 | 现象 | 响应时间 | 示例 |
|---|---|---|---|
| P0 | 集群不可用 | 立即 | API Server 宕机、etcd 故障 |
| P1 | 服务中断 | 30 分钟内 | 核心应用 Pod 全部失败 |
| P2 | 部分功能异常 | 2 小时内 | 单 Pod 故障、性能下降 |
| P3 | 轻微问题 | 计划内 | 配置优化、资源调整 |
总结
本文整理了 Kubernetes 的完整故障排查命令:
- ✅ 集群状态检查(nodes、componentstatuses)
- ✅ Pod 故障排查(状态、日志、事件)
- ✅ Deployment 问题(rollout、回滚)
- ✅ Service 和网络故障(Endpoints、Ingress)
- ✅ 节点故障(NotReady、资源不足)
- ✅ 存储问题(PV、PVC、StorageClass)
- ✅ 资源限制(OOMKilled、CPU 节流)
- ✅ 日志和调试(组件日志、kubectl debug)
运维建议:
- 熟悉常用 kubectl 命令,快速定位问题
- 配置完善的监控告警(Prometheus + Grafana)
- 启用审计日志,追踪配置变更
- 建立故障处理 SOP 和应急预案
- 定期进行故障演练
🔗 相关链接
建议收藏本文,故障排查时快速查阅!有问题欢迎留言讨论!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。







