以下是一个示例代码,它演示了如何按列分组并添加平均值列:
假设我们有一个名为data的数据框,其中包含两列:group和value。我们的目标是按group列分组,并为每个组添加一个新的列average,该列包含该组的value列的平均值。
import pandas as pd
# 创建示例数据
data = pd.DataFrame({'group': ['A', 'A', 'B', 'B', 'C', 'C'],
'value': [1, 2, 3, 4, 5, 6]})
# 按group列分组并计算平均值
grouped_data = data.groupby('group')['value'].mean().reset_index()
# 将结果合并到原始数据框中
data = data.merge(grouped_data, on='group', suffixes=('', '_average'))
print(data)
运行上面的代码将输出以下结果:
group value value_average
0 A 1 1.5
1 A 2 1.5
2 B 3 3.5
3 B 4 3.5
4 C 5 5.5
5 C 6 5.5
在上述代码中,我们首先使用groupby
函数按group列分组数据,并使用mean
函数计算每个组的value列的平均值。然后,我们使用reset_index
函数将分组后的数据重新设置索引,以便后续合并。最后,使用merge
函数将计算得到的平均值列合并到原始数据框中,合并的列名为'value_average'。
上一篇:按列分组数据框,处理值,并根据处理后的值对其他列进行归一化。
下一篇:按列分组值