以下是一个示例代码,通过按组求和,并为每个组创建新变量:
import pandas as pd
# 创建示例数据集
data = {'Group': ['A', 'B', 'A', 'B', 'A', 'B'],
'Value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 按组求和并为每个组创建新变量
df['Sum'] = df.groupby('Group')['Value'].transform('sum')
print(df)
输出结果如下:
Group Value Sum
0 A 1 9
1 B 2 12
2 A 3 9
3 B 4 12
4 A 5 9
5 B 6 12
在示例代码中,我们首先创建了一个包含组('Group')和值('Value')的示例数据集。然后,我们使用groupby
函数按组对值进行分组。接下来,我们使用transform
函数将每个组的总和应用于每个值,并将结果存储在新的'Sum'列中。最后,我们打印出包含原始数据和新变量的数据框。
上一篇:按组求和,保留NA值
下一篇:按组去除重复的年份行