在Airflow中,KubernetesExecutor调度程序使用kube watch进程来观察Kubernetes集群中的任务状态。如果kube watch进程停止运行,任务的状态将无法更新,可能导致任务无法正常完成。
以下是一种可能的解决方法,可以尝试重新启动kube watch进程:
首先,确保你有对Kubernetes集群的访问权限,并且已经安装了kubectl命令行工具。
打开一个终端窗口,使用kubectl命令检查kube watch进程的状态:
kubectl get pods -n
其中,
是Airflow的命名空间。检查输出中是否有名为kube-watch-
的Pod存在。如果该Pod不存在,或者其状态为CrashLoopBackOff
或Error
,则kube watch进程可能已经停止运行。
kubectl delete pod kube-watch- -n
Running
:kubectl get pods -n
Running
状态,那么恭喜你,问题已经解决!任务的状态应该会开始更新了。如果上述方法无法解决问题,还可以尝试以下其他解决方法:
kube_watch_restart_threshold
和kube_watch_restart_delay
。
上一篇:Airflow kubernetesExecutor : Worker pod创建后终止
下一篇:Airflow KubernetesPodOperator 1.10.12 - 任务启动信息已被记录,但容器的标准输出未被记录。