可以通过以下步骤配置 Amazon Sagemaker Python SDK 的输入数据:
准备数据:数据应以适当格式存储在 Amazon S3 存储桶中。例如,图片可以存储在 S3 存储桶的不同文件夹中。
创建数据通道:可以使用 Amazon Sagemaker 提供的 S3 数据通道或自定义数据通道来提供数据。下面是使用自定义数据通道的示例:
import sagemaker
sagemaker_session = sagemaker.Session()
# 定义数据通道的访问路径
data_path = 's3:///'
# 创建指向数据通道的 S3 输入通道
input_data = sagemaker.session.s3_input(s3_data=data_path, content_type='csv')
from sagemaker.estimator import Estimator
train_instace_type = 'ml.m4.xlarge'
train_instance_count = 1
train_volume_size = 50
estimator = Estimator(
image_name=image_name,
role='SageMakerRole',
train_instance_count=train_instance_count,
train_instance_type=train_instace_type,
train_volume_size=train_volume_size,
train_max_run=3600,
input_mode='File',
output_path=s3_model_output_location,
sagemaker_session=sagemaker_session,
)
estimator.fit({'train': input_data})
通过这些步骤,就可以成功配置 Amazon Sagemaker Python SDK 的输入数据。