Airflow:gitSync后,在WebUI上保留过时的DAGs。
创始人
2024-08-02 20:02:04
0
  1. 在您的DAG代码中,确保您已设置正确的路径和git仓库信息:
dag = DAG(
    'my_dag',
    default_args=default_args,
    schedule_interval=timedelta(days=1),
    user_defined_macros={
        'git_home': '/opt/bitnami/git',
        'git_repo': 'https://github.com/myuser/myrepo.git',
        'git_branch': 'master'
    }
)

sync_operator = BashOperator(
    task_id='sync_git_repo',
    bash_command='cd {{ git_home }} && git fetch && git checkout {{ git_branch }} && git pull origin {{ git_branch }}',
    dag=dag
)
  1. 编辑您的Airflow配置文件airflow.cfg,设置[core]部分中的以下值:
dag_processing_store_serialized_dags = True
worker_log_server_port = 8793 #(或其他可用的端口)
  1. 启动Airflow工作器:
airflow worker --log-server-port 8793 #(或其他端口)
  1. 在您的DAG代码中,使用以下代码段,在DAG启动时刷新git同步:
from airflow.models import DagBag
from airflow.utils.log.logging_mixin import LoggingMixin
import urllib.request
import json

log = LoggingMixin().log

def check_for_new_dags(interval=30):
    """
    Check for new DAGs in the Git repository every 'interval' seconds
    
    :param interval: Interval (in seconds) between checks for new DAGs (default: 30)
    """
    while True:
        try:
            # Check Git repository for new DAGs
            urllib.request.urlretrieve('http://localhost:8793/status', 'status.json')
            with open('status.json') as f:
                status = json.load(f)
            if 'gitSync' in status and status['gitSync']:
                dagbag = DagBag(dag_folder='/path/to/dags')
                if dagbag.process_file('my_dag.py'):
                    log.info('DAG "my_dag" updated successfully')
                else:
                    log.warning('DAG "my_dag" failed to update')
            # Wait for the next check interval
            time.sleep(interval)
        except Exception as e:
            log.warning(f'Error checking for new DAGs: {e}')

  1. 启动Airflow web服务器和scheduler。按照步骤2设置的端口运行工作者。
airflow webserver --port 8080
airflow scheduler

这些步骤将确

相关内容

热门资讯

Android Studio ... 要解决Android Studio 4无法检测到Java代码,无法打开SDK管理器和设置的问题,可以...
安装tensorflow mo... 要安装tensorflow models object-detection软件包和pandas的每个...
安装了Laravelbackp... 检查是否创建了以下自定义文件并进行正确的配置config/backpack/base.phpconf...
安装了centos后会占用多少... 安装了CentOS后会占用多少内存取决于多个因素,例如安装的软件包、系统配置和运行的服务等。通常情况...
按照Laravel方式通过Pr... 在Laravel中,我们可以通过定义关系和使用查询构建器来选择模型。首先,我们需要定义Profile...
按照分类ID显示Django子... 在Django中,可以使用filter函数根据分类ID来筛选子类别。以下是一个示例代码:首先,假设你...
Android Studio ... 要给出包含代码示例的解决方法,我们可以使用Markdown语法来展示代码。下面是一个示例解决方案,其...
Android Retrofi... 问题描述:在使用Android Retrofit进行GET调用时,获取的响应为空,即使服务器返回了正...
Alexa技能在返回响应后出现... 在开发Alexa技能时,如果在返回响应后出现问题,可以按照以下步骤进行排查和解决。检查代码中的错误处...
Airflow Dag文件夹 ... 要忽略Airflow中的笔记本检查点,可以在DAG文件夹中使用以下代码示例:from airflow...