在 AWS Lambda 上使用 Puppeteer 时,可能会遇到 Puppeteer 目标关闭错误。这个错误通常是由于 Puppeteer 在 AWS Lambda 环境中无法正常运行所导致的。
以下是一种可能的解决方法,使用了 chrome-aws-lambda 库来处理 Puppeteer 在 Lambda 上的问题。
npm install puppeteer-core chrome-aws-lambda aws-sdk
const chromium = require('chrome-aws-lambda');
const AWS = require('aws-sdk');
exports.handler = async (event, context) => {
let result = null;
let browser = null;
try {
// 创建一个 S3 客户端
const s3 = new AWS.S3();
// 获取页面 URL
const url = event.url;
// 启动 Chrome
browser = await chromium.puppeteer.launch({
args: chromium.args,
defaultViewport: chromium.defaultViewport,
executablePath: await chromium.executablePath,
headless: chromium.headless,
ignoreHTTPSErrors: true,
});
// 打开新页面
const page = await browser.newPage();
// 导航到指定的 URL
await page.goto(url);
// 执行你的 Puppeteer 代码
// ...
// 将结果保存到 S3
const screenshot = await page.screenshot({ fullPage: true });
await s3.putObject({
Bucket: 'YOUR_S3_BUCKET_NAME',
Key: 'screenshot.png',
Body: screenshot,
ACL: 'public-read',
ContentType: 'image/png',
}).promise();
// 返回结果
result = {
statusCode: 200,
body: JSON.stringify({ message: 'Success' }),
};
} catch (error) {
console.error(error);
// 返回错误信息
result = {
statusCode: 500,
body: JSON.stringify({ message: 'Error' }),
};
} finally {
// 关闭 Chrome
if (browser !== null) {
await browser.close();
}
}
return result;
};
替换代码中的 YOUR_S3_BUCKET_NAME 为您的 S3 存储桶名称。
部署 Lambda 函数并测试它是否正常工作。确保您的 Lambda 函数具有适当的权限来访问 S3 存储桶。
这个解决方法通过使用 chrome-aws-lambda 库来提供适用于 AWS Lambda 的 Chrome 版本,从而绕过了 Puppeteer 在 Lambda 环境中的一些限制。