以下是一个示例代码,演示了如何按多列进行分组:
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'Category': ['A', 'B', 'A', 'C', 'B'],
'Region': ['East', 'West', 'East', 'West', 'East'],
'Value': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 按多列进行分组
grouped = df.groupby(['Category', 'Region'])
# 遍历每个分组并打印结果
for name, group in grouped:
print(name)
print(group)
print('\n')
以上代码创建了一个包含姓名、类别、地区和值的示例数据集。然后,使用groupby()方法按Category和Region两列进行分组。
最后,使用一个循环来遍历每个分组,并打印出每个分组的名称和数据。您可以根据需要进行更多的操作,例如计算每个分组的平均值或总和等。
上一篇:按多列对数据框进行汇总
下一篇:按多列分组 pandas