以下是一个示例代码,用于按日期分组的聚合数据,但来自不同的日期字段。
import pandas as pd
# 创建示例数据集
data = {
'日期1': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'日期2': ['2021-02-01', '2021-02-01', '2021-02-02', '2021-02-02', '2021-02-03'],
'数值': [1, 2, 3, 4, 5]
}
df = pd.DataFrame(data)
# 将日期1和日期2列转换为日期时间类型
df['日期1'] = pd.to_datetime(df['日期1'])
df['日期2'] = pd.to_datetime(df['日期2'])
# 按日期1分组,并对数值进行求和
grouped_by_date1 = df.groupby('日期1')['数值'].sum()
print("按日期1分组的聚合数据:")
print(grouped_by_date1)
# 按日期2分组,并对数值进行求和
grouped_by_date2 = df.groupby('日期2')['数值'].sum()
print("按日期2分组的聚合数据:")
print(grouped_by_date2)
输出结果如下:
按日期1分组的聚合数据:
日期1
2021-01-01 3
2021-01-02 7
2021-01-03 5
Name: 数值, dtype: int64
按日期2分组的聚合数据:
日期2
2021-02-01 3
2021-02-02 7
2021-02-03 5
Name: 数值, dtype: int64
在这个示例中,我们首先使用pd.to_datetime()
函数将日期列转换为日期时间类型,然后使用groupby()
函数按日期1分组,并对数值列进行求和。同样的方法也适用于按日期2分组。
上一篇:按日期分组的结果与预期不符。
下一篇:按日期分组的类别中的出现次数统计