在Airflow中,trigger_rule用于定义任务之间的依赖关系。而grandparent tasks则指的是一个任务的父级父级任务,其实就是爷爷级任务。在Airflow中,我们可以通过以下代码示例,来定义grandparent tasks的trigger_rule用法:
from airflow import DAG from airflow.operators.bash_operator import BashOperator from datetime import datetime, timedelta
default_args = { 'owner': 'airflow', 'depends_on_past': False, 'start_date': datetime(2020, 1, 1), 'email': ['airflow@example.com'], 'email_on_failure': False, 'email_on_retry': False, 'retries': 1, 'retry_delay': timedelta(minutes=5), }
dag = DAG( 'grandparent_tasks_trigger_rule', default_args=default_args, description='Grandparent tasks trigger_rule example', schedule_interval=timedelta(days=1), )
t1 = BashOperator( task_id='grandparent_task', bash_command='echo "This is grandparent task"', dag=dag, )
t2 = BashOperator( task_id='parent_task', bash_command='echo "This is parent task"', dag=dag, )
t3 = BashOperator( task_id='child_task', bash_command='echo "This is child task"', dag=dag, )
t1 >> t2 >> t3
t2.trigger_rule = 'all_done'
t3.trigger_rule = 'all_done'
在这个例子中,grandparent_task是父级父级任务,parent_task是父级任务,child_task是子任务。而grandparent_task和parent_task之间的关系是grandparent-grandchild关系,在设置trigger_rule的时候需要注意。默认的trigger_rule规则为'all_success',即所有依赖的任务都成功完成后才会执行本任务。若要将grandparent_task和parent_task的状态作为触发规则,则需要使用'all_done'规则。将父级任务与子任务的状态作为触发规则时,与一般的Airflow依赖关系设置相同,即可统一使用'all_success'规则。