是的,自Apache Beam 2.16.0版本开始,Shuffle服务默认启用。Shuffle服务在将数据从一个节点传输到另一个节点时非常有用。
以下是使用默认启用Shuffle服务的Apache Beam代码示例:
import apache_beam as beam
with beam.Pipeline() as pipeline:
result = (
pipeline
| beam.Create([1, 2, 3, 4, 5])
| beam.Map(lambda x: x * 2)
| beam.Map(lambda x: x * 2)
| beam.Map(lambda x: x * 2)
| beam.Map(lambda x: x * 2)
)
# 打印输出结果
beam.pvalue.MaterializedValueTap(result).get_all()