在Python中,可以使用pandas库来按多个列进行分组并进行产品聚合。
下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'产品': ['A', 'A', 'B', 'B', 'A'],
'类别': ['X', 'Y', 'X', 'Y', 'Y'],
'销量': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 按多个列进行分组并进行产品聚合
grouped = df.groupby(['产品', '类别']).agg({'销量': 'sum'})
print(grouped)
这段代码首先创建了一个示例数据集,包含了产品、类别和销量三个列。然后使用groupby
函数按照产品
和类别
两列进行分组。最后使用agg
函数对分组后的数据进行聚合操作,使用sum
方法对销量
列进行求和。
运行以上代码,输出的结果如下:
销量
产品 类别
A X 10
Y 70
B X 30
Y 40
可以看到,结果中的索引包含了按照产品
和类别
两列分组的结果,以及聚合后的销量
列的值。
上一篇:按多个列分组,并按月/年分组拆分
下一篇:按多个列进行分组并联接