假设我们有一个包含预算、客户和月份的数据框,要按照客户聚合预算。示例数据框如下:
import pandas as pd
import numpy as np
data = {'customer': ['A', 'B', 'C', 'D', 'A', 'B', 'C', 'D'],
'month': ['Jan', 'Jan', 'Jan', 'Jan', 'Feb', 'Feb', 'Feb', 'Feb'],
'budget': [1000, 2000, 1500, 3000, 1200, 1400, 2500, 1800]}
df = pd.DataFrame(data)
将其按客户和月份进行分组,然后使用 sum()
函数对 budget
列进行聚合,最后使用 reset_index()
函数将结果重新设置为数据框格式,并更改列名:
grouped = df.groupby(['customer', 'month'])['budget'].sum().reset_index()
grouped.columns = ['customer', 'month', 'total_budget']
这样,就得到了按客户聚合预算的结果。
上一篇:按客户ID找到两个产品之间的时间