在Airflow中,可以使用PythonOperator来实现动态任务映射。下面是一个示例代码,展示了如何将前一个任务的结果扩展到后续任务中。
首先,导入所需的包和模块:
from airflow import DAG
from airflow.operators.python_operator import PythonOperator
from datetime import datetime
定义一个函数,用于执行任务并返回结果:
def task_function(**kwargs):
# 获取上游任务的结果
previous_task_result = kwargs['ti'].xcom_pull(task_ids='previous_task')
# 对结果进行扩展
extended_result = previous_task_result + ' extended'
# 将结果传递给下游任务
kwargs['ti'].xcom_push(key='extended_result', value=extended_result)
创建一个DAG,并设置默认参数:
default_args = {
'start_date': datetime(2022, 1, 1)
}
dag = DAG('dynamic_task_mapping', schedule_interval=None, default_args=default_args)
定义两个任务,一个产生结果,另一个使用上游任务的结果进行扩展:
task1 = PythonOperator(
task_id='previous_task',
python_callable=lambda: 'result',
dag=dag
)
task2 = PythonOperator(
task_id='next_task',
python_callable=task_function,
provide_context=True,
dag=dag
)
设置任务之间的依赖关系:
task1 >> task2
在这个例子中,task1生成一个结果,并将其作为xcom传递给task2。task2使用task1的结果,并将其扩展后推送到xcom中。你可以在后续任务中继续使用这个扩展后的结果。
请注意,provide_context=True是必需的,以便在任务函数中获取上下文信息,包括task instance(ti)。
这是一个简单的示例,您可以根据自己的需求进行修改和扩展。希望对您有所帮助!