确定文本在图片中的具体位置:使用Amazon Rekognition DetectText API和BoundingBox参数获取文本的位置信息。
通过Java代码调用Textract API:使用Amazon Textract的detectDocumentText方法,将图片中的文本提取出来。
针对缺失文本位置进行后处理:利用文本位置信息和识别出的文本,可使用Amazon Textract的renderDocument方法在原图上渲染新的文本框,从而补全缺失文本位置。
示例代码:
//使用Rekognition API检测文本位置 DetectTextRequest request = new DetectTextRequest() .withImage(new Image() .withS3Object(new S3Object() .withName("image.jpg").withBucket("my-bucket")); DetectTextResult result = rekognitionClient.detectText(request);
//使用Textract API提取文本 DetectDocumentTextRequest detectTextRequest = new DetectDocumentTextRequest() .withDocument(new Document().withBytes(bytes)); DetectDocumentTextResult detectTextResult = textractClient.detectDocumentText(detectTextRequest);
//使用Textract API渲染缺失文本位置 RenderDocumentRequest request = new RenderDocumentRequest() .withDocument(new Document().withBytes(bytes)).withBlocks(detectTextResult.getBlocks()); RenderDocumentResult result = textractClient.renderDocument(request);
上一篇:AmazonTextract在使用SQS和SNS时处理时间过长。
下一篇:AmazonTextract在WebApp演示、AnalyzeDocumentRequest和StartDocumentAnalysisRequest之间返回不同的结果。