要解决这个问题,你可以使用Airflow的@interval
装饰器来定义你的DAG运行的时间间隔。这样,即使DAG被调度为每5分钟运行一次,它也可以在一分钟内运行多次。
下面是一个示例代码,展示如何使用@interval
装饰器来定义DAG的运行时间间隔:
from datetime import datetime, timedelta
from airflow import DAG
from airflow.decorators import task, dag
from airflow.operators.dummy_operator import DummyOperator
@dag(default_args={
'owner': 'airflow',
'start_date': datetime(2022, 1, 1),
'retries': 1,
'retry_delay': timedelta(minutes=5)
}, schedule_interval='@interval(minutes=1)', catchup=False)
def my_dag():
@task
def my_task():
# 你的任务逻辑
pass
start_task = DummyOperator(task_id='start_task')
end_task = DummyOperator(task_id='end_task')
start_task >> my_task() >> end_task
dag = my_dag()
在上面的例子中,my_dag
函数使用@dag
装饰器来定义一个DAG。schedule_interval
参数使用@interval(minutes=1)
来指定DAG的运行时间间隔为每分钟一次。catchup=False
参数用于禁止DAG的回溯。
在my_dag
函数中,你可以定义你的任务逻辑,这里使用了@task
装饰器将my_task
函数定义为一个任务。这个任务将在DAG的执行流程中被调用。
然后,创建了两个DummyOperator
实例来表示开始和结束的任务。通过>>
操作符将它们连接起来,构建了DAG的执行流程。
最后,将my_dag
函数调用生成的DAG对象赋值给dag
变量,以便Airflow可以识别和运行它。
通过这种方式,即使DAG被调度为每5分钟运行一次,它也可以在一分钟内运行多次。请注意,这只是一个示例,你需要根据你的实际需求来定义你的任务逻辑和DAG的执行流程。