以下是一个示例,展示了如何按组对新变量进行数据表解决的方法:
import pandas as pd
# 创建一个示例数据表
data = {'组别': ['A', 'A', 'B', 'B', 'A', 'B'],
'数值': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 使用groupby和transform函数来添加一个新变量
df['新变量'] = df.groupby('组别')['数值'].transform('sum')
print(df)
输出结果如下:
组别 数值 新变量
0 A 1 8
1 A 2 8
2 B 3 13
3 B 4 13
4 A 5 8
5 B 6 13
在这个示例中,我们首先创建了一个包含组别和数值的数据表。然后,使用groupby
函数按组别对数值进行分组,并使用transform
函数计算每个组别的总和。最后,将新变量添加到原始数据表中。
这个方法适用于许多按组计算的场景,可以根据具体需求进行相应的修改和扩展。
上一篇:按组对象的序列填充,Pandas
下一篇:按组对字典中的子数组进行排序