以下是一个示例代码,用于按年份对数据进行分组并总结值:
import pandas as pd
# 创建一个示例数据集
data = pd.DataFrame({'日期': ['2019-01-01', '2019-02-01', '2019-03-01', '2020-01-01', '2020-02-01'],
'数值': [10, 20, 30, 40, 50]})
# 将日期列转换为日期时间类型
data['日期'] = pd.to_datetime(data['日期'])
# 按年份对数据进行分组并计算总和
grouped_data = data.groupby(data['日期'].dt.year)['数值'].sum()
# 打印结果
print(grouped_data)
输出结果:
日期
2019 60
2020 90
Name: 数值, dtype: int64
这段代码首先使用pd.DataFrame
创建了一个示例数据集,包含了日期和数值两列。然后,通过pd.to_datetime
将日期列转换为日期时间类型。
接下来,使用groupby
方法对数据按年份进行分组,data['日期'].dt.year
可以提取出日期的年份。然后,对分组后的数值列使用sum
方法进行求和。
最后,打印出分组后的总和结果。