在Airflow 1.10.3中,SubDag默认只能并行运行一个任务,即使并发度设置为8。这是因为SubDag运行时会创建一个DagRun,并将其作为单个任务运行。
要解决这个问题,可以通过修改Airflow的源代码来实现SubDag的并行运行。下面是一个示例的解决方法:
打开Airflow安装目录下的airflow/models.py
文件。
找到SubDag
类的定义,通常在文件的末尾。示例代码如下:
class SubDag(BaseOperator, SkipMixin):
def __init__(self, subdag, *args, **kwargs):
super(SubDag, self).__init__(*args, **kwargs)
self.subdag = subdag
SubDag
类中添加一个新的方法get_dagrun
,如下所示:class SubDag(BaseOperator, SkipMixin):
def __init__(self, subdag, *args, **kwargs):
super(SubDag, self).__init__(*args, **kwargs)
self.subdag = subdag
def get_dagrun(self, execution_date):
return self.subdag.get_dagrun(execution_date)
现在,SubDag应该可以并行运行多个任务,而不仅限于一个任务。如果你的SubDag有8个任务,设置并发度为8,那么这些任务将会同时运行。
请注意,修改源代码可能会导致Airflow的一些其他功能出现问题,因此在修改之前请确保备份相关文件,并谨慎测试。