问题描述: 当使用Apache Beam Spark Runner在流模式下运行时,可能会遇到以下异常:
java.lang.IllegalAccessException: Class org.apache.spark.sql.catalyst.ScalaReflection$$anonfun$2$$anonfun$apply$5 can not access a member of class com.example.MyClass$MyInnerClass with modifiers ""
解决方法: 这个问题通常是由于Spark无法访问内部类导致的。为了解决这个问题,可以尝试以下方法:
将内部类移动到顶层类中: 将内部类移动到与外部类相同的包中,并确保内部类是顶层类,而不是嵌套类。
package com.example;
public class MyClass {
// 外部类的代码
public static class MyInnerClass {
// 内部类的代码
}
}
使用静态内部类: 如果您不能将内部类移动到顶层类中,可以将内部类声明为静态内部类。
package com.example;
public class MyClass {
// 外部类的代码
public static class MyInnerClass {
// 内部类的代码
}
}
更新Spark配置: 在创建SparkSession之前,尝试设置以下Spark配置,以允许访问私有成员:
SparkConf sparkConf = new SparkConf().set("spark.driver.userClassPathFirst", "true");
SparkSession sparkSession = SparkSession.builder().config(sparkConf).getOrCreate();
这将启用用户类在Spark中的优先级,并允许访问私有成员。
请注意,这些解决方法适用于Apache Beam版本2.28.0及更高版本。如果您使用的是较旧的版本,可能需要升级到最新版本以解决此问题。