以下是一个示例代码,用于按年份计算记录的总数:
import pandas as pd
# 创建示例数据
data = {'日期': ['2019-01-01', '2019-02-01', '2020-01-01', '2020-02-01', '2020-03-01'],
'数值': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 提取年份列
df['年份'] = df['日期'].dt.year
# 按年份计算记录的总数
result = df.groupby('年份').size().reset_index(name='记录总数')
print(result)
这段代码使用pandas库来处理数据。首先,创建了一个示例数据,包含两列:日期和数值。然后,使用pd.to_datetime()
函数将日期列转换为日期类型。接下来,使用dt.year
属性提取出年份,并将其保存在一个新的列中。最后,使用groupby()
函数按年份进行分组,并使用size()
函数计算每个年份的记录数量。最终结果保存在一个新的DataFrame中,并打印出来。
上一篇:按年份进行汇总,包括每年的计数。
下一篇:按年份累加行