下面是一个示例代码,演示了如何按标签将多重索引的数据帧进行分组,并计算每个组的平均值:
import pandas as pd
# 创建一个多重索引的数据帧
data = {'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500]}
df = pd.DataFrame(data, index=[['Group1', 'Group1', 'Group2', 'Group2', 'Group2'],
['Index1', 'Index2', 'Index3', 'Index4', 'Index5']])
# 按标签将数据帧分组,并计算平均值
grouped = df.groupby(level=0) # 按第一级索引进行分组
mean_df = grouped.mean()
print(mean_df)
输出结果如下:
A B C
Group1 1 15.0 150.0
Group2 4 40.0 400.0
在上述示例中,我们首先创建了一个多重索引的数据帧 df。然后,我们使用 groupby() 方法按第一级索引进行分组,并将结果存储在 grouped 变量中。最后,我们使用 mean() 方法计算每个组的平均值,并将结果存储在 mean_df 变量中。最终,我们打印出了计算得到的平均值数据帧。
上一篇:按标签获取最后一个片段