在Python中,可以使用pandas库来按多个列对数据框进行分组。以下是一个示例代码:
import pandas as pd
# 创建一个示例数据框
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick'],
'Age': [20, 25, 30, 20, 25],
'City': ['New York', 'Los Angeles', 'Chicago', 'New York', 'Los Angeles'],
'Salary': [50000, 60000, 70000, 50000, 60000]}
df = pd.DataFrame(data)
# 按多个列进行分组
grouped_df = df.groupby(['Name', 'City'])
# 对分组后的数据进行聚合操作,例如计算平均值
agg_df = grouped_df.mean()
# 打印分组后的结果
print(agg_df)
输出结果如下所示:
Age Salary
Name City
John Chicago 30 70000
Nick Los Angeles 25 60000
Tom New York 20 50000
在上述示例中,我们首先创建了一个示例数据框df。然后,我们使用groupby函数按多个列('Name'和'City')对数据框进行分组。接下来,我们可以对分组后的数据进行各种聚合操作,例如计算均值、求和等。最后,我们打印出分组后的结果。