可以使用Python的pandas库来实现按年份分组并计算每年出现的次数。下面是一个代码示例:
import pandas as pd
# 创建一个包含日期的数据集
data = pd.DataFrame({'date': ['2021-01-01', '2021-01-02', '2021-02-01', '2022-01-01', '2022-02-01']})
# 将日期列转换为日期类型
data['date'] = pd.to_datetime(data['date'])
# 按年份进行分组,并计算每年的出现次数
result = data.groupby(data['date'].dt.year).size().reset_index(name='count')
# 输出结果
print(result)
运行上述代码,将得到如下输出:
date count
0 2021 3
1 2022 2
这个示例中,我们首先创建了一个包含日期的数据集。然后,我们使用pd.to_datetime()
将日期列转换为日期类型。接下来,我们使用groupby()
方法按年份进行分组,并使用size()
方法计算每个组的大小(即出现次数)。最后,我们使用reset_index()
方法重置索引,并将结果命名为count
列。最终,我们打印输出结果,得到了每年出现次数的统计结果。
下一篇:按年份分组,计算每年总和和百分比