您可以使用Pyspark中的count()
函数来获取DataFrame的行数,并使用条件语句来执行相应的操作。以下是一个示例代码:
from pyspark.sql import SparkSession
# 创建SparkSession
spark = SparkSession.builder.getOrCreate()
# 创建示例DataFrame
data = [("Alice", 25), ("Bob", 30), ("Charlie", 35)]
df = spark.createDataFrame(data, ["Name", "Age"])
# 获取DataFrame的行数
row_count = df.count()
# 判断行数是否为0,并执行相应操作
if row_count == 0:
# 如果行数为0,执行操作
print("DataFrame的行数为0,执行操作")
else:
# 如果行数不为0,不执行任何操作
print("DataFrame的行数不为0,不执行任何操作")
在示例代码中,我们首先创建了一个示例DataFrame df
,然后使用count()
函数获取了DataFrame的行数。接下来,我们使用条件语句if
来判断行数是否为0,并执行相应的操作。如果行数为0,则输出"DataFrame的行数为0,执行操作";如果行数不为0,则输出"DataFrame的行数不为0,不执行任何操作"。
上一篇:编写一个Prometheus查询,仅在最近1分钟内开始报告数据时返回1。
下一篇:编写一个Pyspark查询,在PACK_IND为“Y”或“N”时计算exploded_qty和imploded_qty。