下面是一个示例代码,展示了如何按年计算保留率:
import pandas as pd
# 创建示例数据
data = {'年份': [2019, 2019, 2020, 2020, 2020, 2021],
'保留数': [100, 80, 70, 60, 50, 40],
'总数': [100, 120, 90, 80, 70, 60]}
df = pd.DataFrame(data)
# 按年份分组并计算保留率
df_grouped = df.groupby('年份').sum()
df_grouped['保留率'] = df_grouped['保留数'] / df_grouped['总数'] * 100
# 打印结果
print(df_grouped)
输出结果如下:
保留数 总数 保留率
年份
2019 180 220 81.818182
2020 180 240 75.000000
2021 40 60 66.666667
这个示例代码首先创建了一个包含年份、保留数和总数的示例数据表。然后,使用groupby
函数按年份分组,并使用sum
函数计算每个年份的总保留数和总数。最后,通过除以总数并乘以100计算保留率,并将结果存储在新的列中。输出结果显示了每个年份的总保留数、总数和保留率。