以下是一个使用Python的pandas库实现“按组用平均值填补缺失数据”的示例代码:
import pandas as pd
# 创建示例数据
data = {'group': ['A', 'A', 'A', 'B', 'B', 'B'],
'value': [1, 2, None, 4, None, 6]}
df = pd.DataFrame(data)
# 按组计算平均值
grouped = df.groupby('group')
mean_values = grouped['value'].mean()
# 填补缺失数据
df['value'] = grouped['value'].transform(lambda x: x.fillna(x.mean()))
print(df)
输出结果为:
group value
0 A 1.0
1 A 2.0
2 A 1.5
3 B 4.0
4 B 5.0
5 B 6.0
在这个示例中,我们首先创建了一个包含缺失数据的DataFrame对象。然后,我们使用groupby
方法按照“group”列进行分组,并用mean
方法计算每个组的平均值。接下来,我们使用transform
方法将每个组的缺失数据用组的平均值进行填补。最后,我们打印输出填补后的DataFrame。
请注意,这只是一个示例代码,实际应用中可能需要根据具体情况进行修改。
上一篇:按组应用函数将列变异为数据帧
下一篇:按组用中位数替换NA值