kubernetes基础排错

发布时间 2023-10-08 15:42:16作者: 普里莫

要查看 Kubernetes 集群是否正常运行,可以执行以下操作:

  1. 集群节点状态检查:运行以下命令检查集群中所有节点的状态:

    Copy Codekubectl get nodes
    

    输出将显示集群中每个节点的名称、状态和相关信息。确保所有节点都处于正常的 Ready 状态。

  2. POD 状态检查:运行以下命令检查集群中的 Pod 状态:

    Copy Codekubectl get pods -A
    

    这将显示所有命名空间中的 Pod 列表及其状态。验证 Pod 是否处于运行中的状态,并确保没有任何异常或错误。

  3. 控制平面组件状态检查:Kubernetes 的控制平面组件包括 kube-apiserver、kube-controller-manager、kube-scheduler 和 etcd。运行以下命令来检查它们的状态:

    Copy Codekubectl get pods -n kube-system
    

    检查这些组件的 Pod 是否处于运行状态,并确保没有任何异常或错误。

  4. 服务检查:运行以下命令来检查集群中的服务状态:

    Copy Codekubectl get services -A
    

    这将显示所有命名空间中的服务列表及其相关信息。确保关键服务正常运行,并且它们的 IP 和端口处于正确的状态。

删除

# 删除后会从新加载
kubectl delete pod <pod-name> -n kube-system

## 完全删除,要指定启动启
kubectl get deployments      // 查看手动启动的容器

kubectl delete -f /tmp/yyy.yaml             // 资源清单拉启的服务
kubectl delete deployments.apps nginx1      // 手动拉起的服务

ping不通pod的IP

重启docker
systemctl restart docker