在AWS Lambda函数中,可以使用以下Python代码将两列连接在一起并将其作为记录的一部分传递给AWS Firehose。
import json
def lambda_handler(event, context):
output = []
for record in event['records']:
payload = json.loads(record['data'])
# concatenate two columns
payload['new_column'] = payload['column1'] + ' ' + payload['column2']
# remove original columns, if required
# del payload['column1']
# del payload['column2']
output.append({
'recordId': record['recordId'],
'result': 'Ok',
'data': json.dumps(payload)
})
return { 'records': output }
这个函数接受一个事件和一个上下文作为输入,如下所示:
{
"records": [
{
"recordId": "123",
"data": "{\"column1\": \"hello\", \"column2\": \"world\"}"
}
]
}
将两列连接在一起,并将输出格式转换为以下结构:
{
"recordId": "123",
"result": "Ok",
"data": "{\"column1\": \"hello\", \"column2\": \"world\", \"new_column\": \"hello world\"}"
}
如果需要,原始列可以删除。请取消注释以下行:
# del payload['column1']
# del payload['column2']
返回以下格式的记录:
{
"recordId": "123",
"result": "Ok",
"data": "{\"new_column\": \"hello world\"}"
}