在Python中,可以使用pandas库来按多列对数据框进行汇总。下面是一个代码示例:
import pandas as pd
# 创建一个示例数据框
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 35, 40, 45],
'City': ['New York', 'Paris', 'London', 'New York', 'Paris', 'London'],
'Salary': [5000, 6000, 7000, 8000, 9000, 10000]}
df = pd.DataFrame(data)
# 按多列对数据框进行汇总
summary = df.groupby(['City', 'Name']).agg({'Age': 'mean', 'Salary': 'sum'})
print(summary)
输出结果如下:
Age Salary
City Name
London John 37 17000
New York Tom 27 13000
Paris Nick 32 15000
在上面的示例中,我们首先创建了一个示例数据框df。然后,使用groupby方法指定需要进行汇总的列,这里我们选择了'City'和'Name'列。最后,使用agg方法对汇总后的分组数据进行聚合计算,这里我们计算了'Age'列的平均值和'Salary'列的总和。
通过以上的示例,你可以按多列对数据框进行汇总并进行自定义的聚合计算。
上一篇:按多列对表格数据进行分组
下一篇:按多列分组