AWS Glue Crawler的glob Exclude Pattern功能使得用户可以通过指定排除模式来排除不需要抓取的文件或目录。以下是一个代码示例,演示如何使用glob Exclude Pattern来排除特定类型的文件:
import boto3
client = boto3.client('glue', region_name='us-west-2')
response = client.update_crawler(
Name='example-crawler',
Targets={
'S3Targets': [{
'Path': 's3://example-data/',
'Exclusions': ['*.csv']
}]
}
)
在上述代码中,Exclusions
参数将地球指定的模式中所有csv文件都排除在外。
注意:在模式字符串中,*可以匹配任何字符,**匹配任何字符和任何路径段。更多的glob模式语法请参考Python glob模块的文档。