确认输入数据格式是否正确,例如JSON格式是否正确,输入数据是否符合所需的模式和结构。
确定任务名称是否正确,并确保任务名称在您的账户中是唯一的。
检查您是否已授予Amazon SageMaker Ground Truth正确的访问权限。
检查网络连接是否正确,并确保您的网络连接是稳定的。
以下是Python示例代码,说明如何为Amazon SageMaker Ground Truth设置标注流程:
import boto3
import uuid
sagemaker_client = boto3.client('sagemaker')
workteam_arn = 'arn:aws:sagemaker:us-west-2:123456789012:workteam/private-crowd/team-name'
labeling_job_name = 'ground-truth-' + str(uuid.uuid4())
input_s3_uri = 's3://bucket/path/to/input/data.csv'
output_s3_uri = 's3://bucket/path/to/output/'
job_request = {
'LabelingJobName': labeling_job_name,
'InputConfig': {
'DataSource': {
'S3DataSource': {
'ManifestS3Uri': input_s3_uri
}
}
},
'OutputConfig': {
'S3OutputPath': output_s3_uri
},
'RoleArn': 'arn:aws:iam::123456789012:role/ground_truth_labeling_role',
'LabelAttributeName': 'my-label-attribute',
'HumanTaskConfig': {
'WorkteamArn': workteam_arn,
'UiConfig': {
'UiTemplateS3Uri': 's3://bucket/path/to/template'
},
'PreHumanTaskLambdaArn': 'arn:aws:lambda:us-west-2:123456789012:function:pre-human-task',
'TaskKeywords': ['text'],
'TaskTitle': 'Labeling Task for Text Data'
},
'LabelCategoryConfigS3Uri': 's3://bucket/path/to/label/categories',
'StoppingConditions': {
'MaxPercentageOfInputDatasetLabeled': 100
}
}
create_labeling_job_response = sagemaker_client.create_labeling_job(**job_request)
您可以使用此代码创建一个Ground Truth标注任务。在此命令中,我们指定标注任务的名称、输入、输出和其他相关属性。此外,我们还可以设置工作人员团队、使用的UI配置和Lambda函数。对于文本数据,我们还可以指定文本数据