下面是一个使用Python pandas库的示例代码,演示了如何按日期间隔聚合数据。
首先,需要导入pandas库和datetime库:
import pandas as pd
from datetime import datetime
接下来,创建一个包含日期和数值的示例数据集:
data = {'date': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'value': [10, 5, 8, 12, 6]}
df = pd.DataFrame(data)
将日期列转换为日期时间类型:
df['date'] = pd.to_datetime(df['date'])
然后,按日期间隔进行聚合并计算每个日期间隔的总和:
df_agg = df.groupby(pd.Grouper(key='date', freq='D')).sum().reset_index()
在上面的代码中,pd.Grouper(key='date', freq='D')
将日期列分组为每天。
最后,打印聚合后的数据集:
print(df_agg)
完整的代码示例如下:
import pandas as pd
from datetime import datetime
data = {'date': ['2021-01-01', '2021-01-01', '2021-01-02', '2021-01-02', '2021-01-03'],
'value': [10, 5, 8, 12, 6]}
df = pd.DataFrame(data)
df['date'] = pd.to_datetime(df['date'])
df_agg = df.groupby(pd.Grouper(key='date', freq='D')).sum().reset_index()
print(df_agg)
运行以上代码,将得到如下输出:
date value
0 2021-01-01 15
1 2021-01-02 20
2 2021-01-03 6
这样,数据就按照日期间隔聚合并计算了每个日期间隔的总和。
上一篇:按日期间隔检索多列并按组聚合
下一篇:按日期间隔选择多行(导致重复项)