以下是一个示例代码,演示如何按列分组并填充缺失值:
import pandas as pd
# 创建一个示例数据集
data = {'Group': ['A', 'A', 'A', 'B', 'B', 'B'],
'Value': [1, 2, None, 4, None, 6]}
df = pd.DataFrame(data)
# 按列分组并填充缺失值
df['Value'] = df.groupby('Group')['Value'].transform(lambda x: x.fillna(x.mean()))
print(df)
这段代码首先创建了一个示例数据集,其中包含两列:Group列和Value列。然后,使用groupby
函数按Group列进行分组,并使用transform
函数将每个组的缺失值填充为该组的均值。最后,打印出填充后的数据集。
运行以上代码,输出如下结果:
Group Value
0 A 1.0
1 A 2.0
2 A 1.5
3 B 4.0
4 B 5.0
5 B 6.0
可以看到,缺失值已经被按列分组后的均值填充了。在Group A中,缺失值2被填充为1.5,而在Group B中,缺失值5被填充为5.0。
上一篇:按列分组合并数据框
下一篇:按列分组获取多行计数的SQL