要解决这个问题,我们可以使用Python中的pandas库来处理数据和生成描述表。以下是一个包含代码示例的解决方法:
import pandas as pd
# 创建一个包含年份和组别观察数量的数据框
data = {
'Year': [2010, 2010, 2011, 2011, 2012, 2012],
'Category': ['A', 'B', 'A', 'B', 'A', 'B'],
'Observation': [10, 15, 12, 18, 20, 25]
}
df = pd.DataFrame(data)
# 使用groupby函数按年份和组别对数据框进行分组,并计算每个组别的观察数量的描述统计量
grouped_df = df.groupby(['Year', 'Category'])['Observation'].describe()
# 打印描述表
print(grouped_df)
运行以上代码会输出以下结果:
count mean std min 25% 50% 75% max
Year Category
2010 A 1.0 10.0 NaN 10.0 10.00 10.0 10.00 10.0
B 1.0 15.0 NaN 15.0 15.00 15.0 15.00 15.0
2011 A 1.0 12.0 NaN 12.0 12.00 12.0 12.00 12.0
B 1.0 18.0 NaN 18.0 18.00 18.0 18.00 18.0
2012 A 1.0 20.0 NaN 20.0 20.00 20.0 20.00 20.0
B 1.0 25.0 NaN 25.0 25.00 25.0 25.00 25.0
上述代码首先创建了一个包含年份、组别和观察数量的数据框。然后使用groupby
函数按年份和组别对数据进行分组,并使用describe
函数计算每个组别的观察数量的描述统计量。最后打印出描述表。
下一篇:按年份划分的低于阈值的值的百分比