AWS 数据管道:将 CSV 文件从 S3 上传到 DynamoDB
创始人
2024-11-18 07:01:04
0

以下是一个使用AWS数据管道将CSV文件从S3上传到DynamoDB的解决方案,包含代码示例:

  1. 创建一个Lambda函数来处理数据管道的转换和加载任务:
import boto3

def lambda_handler(event, context):
    input_bucket = event['inputBucket']
    input_key = event['inputKey']
    output_table = event['outputTable']

    # 从S3下载CSV文件
    s3 = boto3.client('s3')
    s3.download_file(input_bucket, input_key, '/tmp/input.csv')
    
    # 处理CSV文件,转换为DynamoDB条目
    items = []
    with open('/tmp/input.csv', 'r') as file:
        lines = file.readlines()
        headers = lines[0].strip().split(',')
        for line in lines[1:]:
            values = line.strip().split(',')
            item = {}
            for i in range(len(headers)):
                item[headers[i]] = values[i]
            items.append(item)
    
    # 将转换后的条目加载到DynamoDB表中
    dynamodb = boto3.resource('dynamodb')
    table = dynamodb.Table(output_table)
    with table.batch_writer() as batch:
        for item in items:
            batch.put_item(Item=item)
    
    return 'Data pipeline completed successfully.'
  1. 创建一个数据管道定义文件(pipeline-definition.json),指定输入和输出:
{
  "objects": [
    {
      "id": "S3Input",
      "name": "S3Input",
      "schedule": {
        "ref": "DefaultSchedule"
      },
      "type": "S3DataNode",
      "dataFormat": {
        "ref": "CSVDataFormat"
      },
      "scheduleType": "ONDEMAND",
      "directoryPath": "#{myInputS3Path}",
      "errorThreshold": 0,
      "errorHandlingConfig": {
        "failOnError": true
      }
    },
    {
      "id": "DynamoDBOutput",
      "name": "DynamoDBOutput",
      "schedule": {
        "ref": "DefaultSchedule"
      },
      "type": "DynamoDBDataNode",
      "scheduleType": "ONDEMAND",
      "tableName": "#{myOutputDynamoDBTable}",
      "errorThreshold": 0,
      "errorHandlingConfig": {
        "failOnError": true
      }
    }
  ],
  "parameters": [
    {
      "id": "myInputS3Path",
      "description": "S3 input path",
      "type": "String"
    },
    {
      "id": "myOutputDynamoDBTable",
      "description": "DynamoDB output table",
      "type": "String"
    }
  ]
}
  1. 创建一个数据管道任务,指定Lambda函数和数据管道定义文件:
import boto3

def create_data_pipeline(input_bucket, input_key, output_table):
    client = boto3.client('datapipeline')
    
    # 创建数据管道定义
    with open('pipeline-definition.json', 'r') as file:
        pipeline_definition = file.read()
    
    # 创建数据管道
    response = client.create_pipeline(
        name='csv-to-dynamodb-pipeline',
        uniqueId='csv-to-dynamodb-pipeline',
        description='Pipeline to upload CSV file to DynamoDB',
        pipelineTags=[
            {
                'key': 'environment',
                'value': 'development'
            },
        ],
        pipelineObjects=[
            {
                'id': 'S3Input',
                'name': 'S3Input',
                'fields': [
                    {
                        'key': 'myInputS3Path',
                        'stringValue': 's3://' + input_bucket + '/' + input_key
                    }
                ]
            },
            {
                'id': 'DynamoDBOutput',
                'name': 'DynamoDBOutput',
                'fields': [
                    {
                        'key': 'myOutputDynamoDBTable',
                        'stringValue': output_table
                    }
                ]
            }
        ],
        parameterObjects=[
            {
                'id': 'myInputS3Path',
                'attributes': []
            },
            {
                'id': 'myOutputDynamoDBTable',
                'attributes': []
            }
        ],
        parameterValues=[
            {
                'id': 'myInputS3Path',
                'stringValue': 's3://' + input_bucket + '/' + input_key
            },
            {
                'id': 'myOutputDynamoDBTable',
                'stringValue': output_table
            }
        ],
        pipelineDefinition=pipeline_definition
    )
    

相关内容

热门资讯

安卓换鸿蒙系统会卡吗,体验流畅... 最近手机圈可是热闹非凡呢!不少安卓用户都在议论纷纷,说鸿蒙系统要来啦!那么,安卓手机换上鸿蒙系统后,...
安卓系统拦截短信在哪,安卓系统... 你是不是也遇到了这种情况:手机里突然冒出了很多垃圾短信,烦不胜烦?别急,今天就来教你怎么在安卓系统里...
app安卓系统登录不了,解锁登... 最近是不是你也遇到了这样的烦恼:手机里那个心爱的APP,突然就登录不上了?别急,让我来帮你一步步排查...
安卓系统要维护多久,安卓系统维... 你有没有想过,你的安卓手机里那个陪伴你度过了无数日夜的安卓系统,它究竟要陪伴你多久呢?这个问题,估计...
windows官网系统多少钱 Windows官网系统价格一览:了解正版Windows的购买成本Windows 11官方价格解析微软...
安卓系统如何卸载app,轻松掌... 手机里的App越来越多,是不是感觉内存不够用了?别急,今天就来教你怎么轻松卸载安卓系统里的App,让...
怎么复制照片安卓系统,操作步骤... 亲爱的手机控们,是不是有时候想把自己的手机照片分享给朋友,或者备份到电脑上呢?别急,今天就来教你怎么...
安卓系统应用怎么重装,安卓应用... 手机里的安卓应用突然罢工了,是不是让你头疼不已?别急,今天就来手把手教你如何重装安卓系统应用,让你的...
iwatch怎么连接安卓系统,... 你有没有想过,那款时尚又实用的iWatch,竟然只能和iPhone好上好?别急,今天就来给你揭秘,怎...
iphone系统与安卓系统更新... 最近是不是你也遇到了这样的烦恼?手机更新系统总是失败,急得你团团转。别急,今天就来给你揭秘为什么iP...