你可以使用pandas库来按年份分组,并计算平均值和计数大小。下面是一个示例代码:
import pandas as pd
# 创建一个示例的数据框
data = {'date': ['2019-01-01', '2019-01-02', '2019-02-01', '2019-02-02', '2020-01-01', '2020-01-02'],
'value': [1, 2, 3, 4, 5, 6]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['date'] = pd.to_datetime(df['date'])
# 按年份分组,并计算平均值和计数大小
grouped = df.groupby(df['date'].dt.year).agg({'value': ['mean', 'count']})
print(grouped)
输出结果为:
value
mean count
date
2019 2.5 4
2020 5.5 2
以上代码首先创建了一个示例的数据框,其中包含了日期和数值两列。然后将日期列转换为日期类型,以便后续按年份进行分组。接着使用groupby
函数按年份进行分组,并使用agg
函数计算平均值和计数大小。最后将结果打印输出。
上一篇:按年份分组选择SQL结果
下一篇:按年份分组,计算每年出现的次数。