在Airflow中,可以使用execution_date
来获取作业的执行时间。通过使用execution_date - timedelta(days=1)
可以获取到昨天的日期。然后,可以根据昨天的日期来设置作业的超时时间。
以下是一个示例代码:
from datetime import timedelta
from airflow import DAG
from airflow.operators.dummy_operator import DummyOperator
from airflow.utils.dates import days_ago
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': days_ago(1),
'retries': 1,
'retry_delay': timedelta(minutes=5),
}
dag = DAG(
'example_dag',
default_args=default_args,
description='A simple DAG',
schedule_interval=timedelta(days=1),
)
def set_timeout(**context):
yesterday = context['execution_date'] - timedelta(days=1)
timeout = int(yesterday.strftime('%H')) * 3600 # 设置超时时间为昨天的小时数*3600秒
context['ti'].duration = timeout
task1 = DummyOperator(
task_id='task1',
dag=dag,
)
task2 = DummyOperator(
task_id='task2',
dag=dag,
on_execute_callback=set_timeout, # 在任务执行时调用set_timeout函数
)
task1 >> task2
在上面的示例中,我们定义了一个名为set_timeout
的函数,它接收一个context
参数,其中包含了作业的执行上下文信息。在这个函数中,我们使用context['execution_date']
获取到作业的执行时间,然后减去一天(timedelta(days=1)
),得到昨天的日期。接着,我们将昨天的小时数乘以3600(秒),得到超时时间,并将其赋值给context['ti'].duration
。这样,在任务执行时,就会根据昨天的运行时间来设置超时时间。
在示例中,task2
任务的on_execute_callback
参数指定了set_timeout
函数,这样在任务执行时会调用该函数来设置超时时间。
注意:上述代码仅适用于以小时为单位的超时时间。如果需要以分钟或秒为单位设置超时时间,可以根据需求修改代码。