Airflow 2引入了Dynamic Task(动态任务)的概念,允许根据DAG运行时配置动态创建任务。以下是一个示例解决方案,其中包含创建动态任务的代码示例:
from airflow import DAG
from airflow.operators.python import PythonOperator, BranchPythonOperator
from airflow.utils.task_group import TaskGroup
def create_dynamic_task(task_id):
def _dynamic_task():
print(f"Running dynamic task: {task_id}")
return PythonOperator(
task_id=task_id,
python_callable=_dynamic_task,
dag=dag,
)
def conditionally_create_task(**kwargs):
dag_run = kwargs.get('dag_run')
config = dag_run.conf
# 根据配置获取需要创建的动态任务列表
dynamic_tasks = config.get('dynamic_tasks', [])
with TaskGroup("dynamic_tasks_group") as dynamic_tasks_group:
for task in dynamic_tasks:
create_dynamic_task(task)
def on_failure_callback(context):
# 在任务运行失败时执行的回调函数
print("Dynamic task failed!")
default_args = {
'owner': 'airflow',
'start_date': datetime(2022, 1, 1),
'on_failure_callback': on_failure_callback,
}
with DAG('dynamic_task_dag', default_args=default_args, schedule_interval=None) as dag:
task1 = PythonOperator(
task_id='task1',
python_callable=lambda: print("Running task1"),
)
task2 = PythonOperator(
task_id='task2',
python_callable=lambda: print("Running task2"),
)
branch_task = BranchPythonOperator(
task_id='branch_task',
python_callable=conditionally_create_task,
provide_context=True,
)
end_task = PythonOperator(
task_id='end_task',
python_callable=lambda: print("Running end_task"),
)
task1 >> task2 >> branch_task >> end_task
在上面的示例中,我们定义了一个DAG,其中包含了一个静态的任务task1
和task2
,然后使用BranchPythonOperator
根据DAG运行时配置动态创建任务。在conditionally_create_task
函数中,我们从dag_run.conf
中获取配置,并使用TaskGroup
将动态创建的任务分组,然后使用create_dynamic_task
函数创建动态任务,并将其添加到任务分组中。在on_failure_callback
中,我们定义了一个任务运行失败时的回调函数。
请注意,这只是一个示例,您可以根据自己的需求进行调整和扩展。