此错误通常是由于数据源中存在类似命名的列引起的,因此需要对数据源中的列进行明确定义以消除模糊性。您可以使用以下代码示例来明确指定列名:
# 指定文件格式
source_data = glueContext.create_dynamic_frame.from_options(
format_options={"quoteChar": '"', "delimiter": ","},
connection_type="s3",
connection_options={"path": "s3://input-bucket/data.csv"},
)
# 指定列名
mapped_source_data = Map.apply(frame=source_data, f=apply_column_mapping)
# 指定列名的函数
def apply_column_mapping(record):
return {
"column1": record["value1"],
"column2": record["value2"],
"column3": record["value3"],
}
上一篇:AWSGlue4.0中同一作业内的Python多进程被挂起。
下一篇:AWSGlue:Anerroroccurredwhilecallingo100.pyWriteDynamicFrame.Failedtofinddatasource:UNKNOWN