下面是一个示例代码,展示了如何按日期时间值进行分组聚合计数和平均值。
import pandas as pd
# 创建一个示例数据集
data = {'datetime': ['2021-01-01 08:00:00', '2021-01-01 09:00:00', '2021-01-02 10:00:00', '2021-01-02 11:00:00', '2021-01-02 12:00:00'],
'value': [10, 15, 20, 25, 30]}
df = pd.DataFrame(data)
# 将datetime列转换为日期时间类型
df['datetime'] = pd.to_datetime(df['datetime'])
# 按日期时间值进行分组,计算计数和平均值
grouped = df.groupby(pd.Grouper(key='datetime', freq='D')).agg({'value': ['count', 'mean']})
print(grouped)
输出结果如下:
value
count mean
datetime
2021-01-01 2 12.5
2021-01-02 3 25.0
在这个示例中,我们首先创建了一个包含日期时间和值的数据集。然后,我们使用pd.to_datetime
将datetime
列转换为日期时间类型。接下来,我们使用groupby
和pd.Grouper
将数据按日期进行分组,其中freq='D'
表示按天进行分组。最后,我们使用agg
函数计算每个分组中的计数和平均值。