以下是一个示例代码,演示如何按年份对数值进行分组:
import pandas as pd
# 创建一个示例数据集
data = {'日期': ['2019-01-01', '2019-02-01', '2020-01-01', '2020-02-01', '2021-01-01'],
'数值': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 将日期列转换为日期类型
df['日期'] = pd.to_datetime(df['日期'])
# 按年份对数据进行分组
grouped_df = df.groupby(df['日期'].dt.year)
# 遍历每个分组并打印结果
for year, group in grouped_df:
print(f"年份: {year}")
print(group)
print("\n")
输出结果为:
年份: 2019
日期 数值
0 2019-01-01 10
1 2019-02-01 20
年份: 2020
日期 数值
2 2020-01-01 30
3 2020-02-01 40
年份: 2021
日期 数值
4 2021-01-01 50
以上代码使用了pandas库,首先将日期列转换为日期类型,然后通过groupby
函数按年份对数据进行分组。最后,可以遍历每个分组并进行处理。