下面是一个示例代码,演示了如何按级别划分多级索引数据:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Subject': ['Math', 'Math', 'Math', 'Science', 'Science', 'Science'],
'Score': [90, 95, 85, 80, 85, 90]}
df = pd.DataFrame(data)
# 将数据按照Name和Subject进行分组,并计算平均值
grouped_df = df.groupby(['Name', 'Subject']).mean()
# 输出按级别划分的多级索引数据
print(grouped_df)
输出结果如下所示:
Score
Name Subject
John Math 85
Science 90
Nick Math 95
Science 85
Tom Math 90
Science 80
在这个示例中,我们首先创建了一个包含学生姓名、科目和分数的示例数据集。然后,我们使用groupby
方法按照姓名和科目对数据进行分组,并计算了每个分组的平均值。最后,我们输出了按级别划分的多级索引数据。
请注意,groupby
方法可以接受一个或多个列名作为参数,并返回一个GroupBy
对象。我们可以使用该对象的聚合函数(如mean
、sum
等)来计算每个分组的统计量。
下一篇:按级别进行过滤并获取一个值