在Airflow中,可以使用trigger_rule
参数来定义任务之间的依赖关系。默认情况下,trigger_rule
参数的值为all_success
,即所有的父任务都成功执行后,子任务才会被触发执行。如果父任务中的某个任务失败,子任务将不会被触发执行。
如果要实现触发规则为none_failed
的任务无法正确跳过的需求,可以通过设置trigger_rule
参数为one_failed
来解决。这样,当父任务中的至少一个任务失败时,子任务将被触发执行。
以下是一个代码示例:
from airflow import DAG
from airflow.operators.dummy_operator import DummyOperator
dag = DAG('example_dag', schedule_interval=None)
task1 = DummyOperator(task_id='task1', trigger_rule='all_success', dag=dag)
task2 = DummyOperator(task_id='task2', trigger_rule='all_success', dag=dag)
task3 = DummyOperator(task_id='task3', trigger_rule='one_failed', dag=dag)
task4 = DummyOperator(task_id='task4', trigger_rule='one_failed', dag=dag)
task1 >> task3 >> task4
task2 >> task3 >> task4
在上面的示例中,task1
和task2
是两个父任务,它们都必须成功执行才会触发执行task3
和task4
。如果task1
或task2
中的任何一个任务失败,task3
和task4
将会被触发执行。
需要注意的是,trigger_rule
参数的可选值还包括all_failed
、none_failed
、all_done
和one_success
,具体取决于你的需求。