新建一个名为“last_month_sales”的列,该列包含每个机器和产品的上个月平均销售额。可以使用pandas的groupby()和rolling()方法来完成这一任务。
示例代码:
import pandas as pd
# 创建数据框
df = pd.DataFrame({
'machine_id': ['M001', 'M001', 'M001', 'M002', 'M002', 'M003'],
'item_id': ['A001', 'A002', 'A003', 'A002', 'A003', 'A003'],
'sales': [23, 32, 18, 27, 54, 12],
'date': ['2021-01-01', '2021-01-15', '2021-02-01', '2021-02-15', '2021-03-01', '2021-03-15']
})
# 将日期转换为日期时间类型并设置为索引
df['date'] = pd.to_datetime(df['date'], format='%Y-%m-%d')
df.set_index('date', inplace=True)
# 计算每个机器和产品的上个月平均销售额
df['last_month_sales'] = df.groupby(['machine_id', 'item_id'])['sales'].rolling(window='30d', min_periods=1).mean().reset_index(level=[0,1], drop=True)
# 打印结果
print(df)
输出结果:
machine_id item_id sales last_month_sales
date
2021-01-01 M001 A001 23 23.000000
2021-01-15 M001 A002 32 32.000000
2021-02-01 M001 A003 18 18.000000
2021-02-15 M002 A002 27 27.000000
2021-03-01 M002 A003