以下是一个示例代码,用于按年累计数据,并选择前5名:
import pandas as pd
# 创建一个示例数据集
data = {'Year': [2019, 2019, 2019, 2020, 2020, 2020, 2021, 2021, 2021],
'Name': ['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C'],
'Value': [10, 20, 30, 40, 50, 60, 70, 80, 90]}
df = pd.DataFrame(data)
# 按年份和名称进行分组,并计算累计值
df['Cumulative'] = df.groupby(['Year', 'Name'])['Value'].cumsum()
# 按年份和累计值进行排序,选择前5名
top5 = df.sort_values(['Year', 'Cumulative'], ascending=[True, False]).groupby('Year').head(5)
print(top5)
这个代码示例假设你有一个包含年份、名称和数值的数据集。首先,它使用groupby
函数按年份和名称进行分组,并通过cumsum
函数计算每个组的累计值。然后,它使用sort_values
函数按年份和累计值进行排序,以便选择前5名。最后,它打印出结果。
下一篇:按年龄从数组中筛选人员