在Airflow中,有两个关键概念- DAG 和任务实例(Task Instance)。 执行日期(Execution Date)是指 DAG 需要开始运行的日期。它是从实例化 DAG(dag = DAG(“mysuperdag”,start_date = datetime(2019,1,1)))开始的。每个任务实例都有特定的执行日期,它是根据 DAG 的开始日期和 timedelta 属性计算出来的。默认情况下,timedelta 在 UTC 中。
当timedelta被解释为UTC时间时,由于夏令时的原因,它可能不会被解释为您希望的时间。为了避免此问题,可以使用pytz库中可用的本地时区,并在DAG实例化中将timezone属性设置为此本地时区。也可以在Timetable的构造函数中使用“tzinfo=pytz.timezone(“您的本地时区”)”选项。
以下是一个示例DAG,它使用本地时区处理夏令时:
from datetime import datetime, timedelta
import pytz
from airflow import DAG
from airflow.operators.bash_operator import BashOperator
local_tz = pytz.timezone('Europe/London')
default_args = {
'start_date': datetime(2019, 1, 1, tzinfo=local_tz),
'depends_on_past': False,
'retries': 1,
'retry_delay': timedelta(minutes=5),
}
dag = DAG(
'my_dag',
default_args=default_args,
description='A simple tutorial DAG',
schedule_interval=timedelta(days=1),
catchup=False,
)
t1 = BashOperator(
task_id='my_task',
bash_command='date',
dag=dag,
)
在这个示例DAG中,我们首先实例化了本地时区'Europe/London'。然后,我们将本地时区设置为DAG实例化中的开始日期。最后,我们将DAG传递给BashOperator的实例,该实例将在每天运行一次的新任务实例中运行。
现在,无论何时执行该DAG,timedelta都不会因为夏令时的改变而改变。