使用Python中的pandas库,假设有一个数据集df包含一个日期时间列“datetime”,代码示例如下:
import pandas as pd
# 生成示例数据
date_rng = pd.date_range(start='2021-01-01 00:00:00', end='2021-01-01 00:40:00', freq='30S')
df = pd.DataFrame(date_rng, columns=['datetime'])
# 按5分钟的间隔将日期时间列分组
df['grouped_datetime'] = df['datetime'].apply(lambda x: x.strftime('%Y-%m-%d %H:%M:00')).astype('datetime64')
df_grouped = df.groupby('grouped_datetime').count()
解释:
最终输出结果包含两列,第一列为“grouped_datetime”,即按5分钟间隔分组的日期时间,第二列为“datetime”,表示在该时间段内包含的元素数量。