AWS Transcribe 是一种自动语音识别服务,可以将人的语音转换为文字记录。以下是使用 AWS Transcribe 进行转录的示例代码:
首先,您需要在 AWS 控制台中创建一个 Transcribe 作业,并上传要转录的音频文件。
然后,您可以使用以下 Python 代码来检索 Transcribe 作业并获取转录的结果:
import boto3
transcribe = boto3.client('transcribe')
job_name = 'your_job_name'
result = transcribe.get_transcription_job(TranscriptionJobName=job_name)
status = result['TranscriptionJob']['TranscriptionJobStatus']
if status == "COMPLETED":
transcript_uri = result['TranscriptionJob']['Transcript']['TranscriptFileUri']
传输的输出将是 JSON 格式的 TranscriptionJob 对象。其中,TranscriptionJobStatus 将告诉您作业的状态,TranscriptFileUri 将是转录结果的 URI。
例如,如果您要将名为 "example-job" 的作业检索到当前目录,并打印结果:
import os
import json
import urllib.request
transcribe = boto3.client('transcribe')
job_name = 'example-job'
result = transcribe.get_transcription_job(TranscriptionJobName=job_name)
status = result['TranscriptionJob']['TranscriptionJobStatus']
if status == "COMPLETED":
transcript_uri = result['TranscriptionJob']['Transcript']['TranscriptFileUri']
response = urllib.request.urlopen(transcript_uri)
data = response.read()
text = json.loads(data)['results']['transcripts'][0]['transcript']
print(text)
当 TranscriptionJobStatus 为(COMPLETED 时,将 TranscriptionJob URL 转储到本地文件并使用 URI 提取转录。
然后就可以得到音频文件的转录结果。