在Python中,可以使用pandas库来按类别分组、聚合和填充缺失值。下面是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'类别': ['A', 'A', 'B', 'B', 'C', 'C'],
'数值': [1, 2, 3, None, 5, 6]}
df = pd.DataFrame(data)
# 按类别分组,对数值列进行聚合(求平均值)
df_agg = df.groupby('类别')['数值'].mean()
# 填充缺失值
df_filled = df_agg.fillna(0)
print(df_filled)
输出结果:
类别
A 1.5
B 3.0
C 5.5
Name: 数值, dtype: float64
在上述代码中,首先创建了一个DataFrame对象df,包含两列数据:类别和数值。然后使用groupby函数按类别进行分组,并对数值列进行聚合,这里使用了mean函数计算平均值。最后,使用fillna函数将缺失值填充为0。最终输出的结果是一个Series对象,包含按类别分组并聚合后的数值结果。
上一篇:按所有键对对象数组进行分组和聚合
下一篇:按所有列进行分组