这个错误通常是由于每个AWS Glue job定义的任务容量超过了AWS Glue的限制而引起的。解决此问题的一种方法是调整Glue作业定义中的参数,以便降低任务所需的内存和vCPU数。也可以增加相应的AWS Glue工作流容量限制。以下是一些示例代码,可用于解决此错误:
glue_context = GlueContext(SparkContext.getOrCreate(conf=SparkConf().setAppName("MyApp").set("spark.executor.memory", "4g").set("spark.executor.cores", "2")))
import boto3
glue = boto3.client("glue")
glue.update_workflow_start_to_run(workflowName="myWorkflow", defaultRunProperties={"AllocatedCapacity": "24"})