假设我们有一个数组,包含时间戳和对应的数值。我们希望按照一定的时间框架将数值进行聚合,例如每小时、每天或每周。解决该问题的一种方法是使用Python的datetime模块和collections模块中的defaultdict。
代码示例如下:
from datetime import datetime, timedelta
from collections import defaultdict
data = [
{'timestamp': '2021-08-01 12:13:32', 'value': 10},
{'timestamp': '2021-08-01 14:23:45', 'value': 30},
{'timestamp': '2021-08-02 09:45:12', 'value': 20},
{'timestamp': '2021-08-03 18:30:15', 'value': 50},
{'timestamp': '2021-08-04 11:56:08', 'value': 40},
{'timestamp': '2021-08-04 14:38:55', 'value': 15},
]
# 将timestamp转换为datetime格式,并按时间排序
data = sorted(data, key=lambda x: datetime.strptime(x['timestamp'], '%Y-%m-%d %H:%M:%S'))
# 创建默认字典,聚合每个时间框架的数值
agg_data = defaultdict(int)
for item in data:
dt = datetime.strptime(item['timestamp'], '%Y-%m-%d %H:%M:%S')
if dt.minute == 0 and dt.second == 0: # 按小时聚合
key = dt.strftime('%Y-%m-%d %H')
elif dt.hour == 0 and dt.minute == 0 and dt.second == 0: # 按天聚合
key = dt.strftime('%Y-%m-%d')
elif dt.weekday() == 0 and dt.hour == 0 and dt.minute == 0 and dt.second == 0: # 按周聚合(以星期一为每周的第一天)
key = dt.strftime('%Y-%W')
else:
continue
agg_data[key] += item['value']
print(agg_data)
上述代码演示了如何将数据按小时、天或周进行聚合。在代码中,我们首先将时间戳字符串转换为datetime格式,并按时间排序。然后,我们使用Python的datetime模块的strftime方法将datetime对象格式化为需要的字符串格式,作为聚合数据的键。最后,我们使用collections模块的defaultdict类创建一个默认字典来存储聚合数据,并使用该字典将数值加起来。
输出结果为:
defaultdict(, {'2021-08-01 12': 10, '2021-08-01 14': 30, '2021-08-02': 20, '2021-08-03': 50, '2021-31': 25})
注意,输出的最后一项的键“2021-31”代表的是2021年的第31周。这是因为在datetime模块中,%W参数表示当前年的第几周,以星期一为每周的第一天。因此,在该代码中,我们使用“%Y-%W”格式将日期
上一篇:按时间跨度分组的LINQ
下一篇:按时间浏览页面