假设我们有一个数据集包含了不同天的某人的消费记录,其中使用了相同的ID号来表示同一人。现在要以ID为依据,计算每个人的总消费。
首先,我们需要读入数据集,数据集可以是一个csv文件,也可以是一个数据框。以下给出数据框的读取方法:
import pandas as pd
data = pd.DataFrame({'ID':[1,2,3,1,2,3,1,2,3],
'Date':['2022-01-01','2022-01-01','2022-01-01','2022-01-02','2022-01-02','2022-01-02','2022-01-03','2022-01-03','2022-01-03'],
'Spent':[10,20,30,15,25,35,20,30,40]})
接下来,我们可以使用groupby()方法来按ID进行分组,然后使用agg()方法来计算每个人的总消费。
total_spent = data.groupby('ID')['Spent'].agg('sum')
最后,我们可以将结果输出。
print(total_spent)
输出结果:
ID
1 50
2 75
3 105
Name: Spent, dtype: int64
这个结果显示,ID为1的人总共花费50元,ID为2的人总共花费75元,ID为3的人总共花费105元。