以下是一个示例代码,展示了如何按日期范围分组:
import datetime
# 创建一个包含日期的示例数据列表
data = [
{'date': datetime.date(2021, 1, 1), 'value': 10},
{'date': datetime.date(2021, 1, 2), 'value': 20},
{'date': datetime.date(2021, 1, 3), 'value': 15},
{'date': datetime.date(2021, 1, 4), 'value': 25},
{'date': datetime.date(2021, 1, 5), 'value': 30},
{'date': datetime.date(2021, 1, 6), 'value': 35},
{'date': datetime.date(2021, 1, 7), 'value': 40},
{'date': datetime.date(2021, 1, 8), 'value': 45},
{'date': datetime.date(2021, 1, 9), 'value': 50},
{'date': datetime.date(2021, 1, 10), 'value': 55},
]
# 按日期范围分组的函数
def group_by_date_range(data, start_date, end_date, range_size):
# 创建一个空字典来存储分组结果
grouped_data = {}
# 计算日期范围的数量
num_ranges = (end_date - start_date).days // range_size
# 初始化每个范围的值为0
for i in range(num_ranges):
range_start = start_date + datetime.timedelta(days=i * range_size)
range_end = range_start + datetime.timedelta(days=range_size-1)
range_label = f'{range_start.strftime("%Y-%m-%d")} to {range_end.strftime("%Y-%m-%d")}'
grouped_data[range_label] = 0
# 将数据分配到相应的日期范围中
for item in data:
item_date = item['date']
# 确定数据项所属的日期范围
for i in range(num_ranges):
range_start = start_date + datetime.timedelta(days=i * range_size)
range_end = range_start + datetime.timedelta(days=range_size-1)
# 如果数据项的日期在范围内,则将其值添加到相应的范围
if range_start <= item_date <= range_end:
range_label = f'{range_start.strftime("%Y-%m-%d")} to {range_end.strftime("%Y-%m-%d")}'
grouped_data[range_label] += item['value']
break
return grouped_data
# 测试函数
start_date = datetime.date(2021, 1, 1)
end_date = datetime.date(2021, 1, 10)
range_size = 3
result = group_by_date_range(data, start_date, end_date, range_size)
print(result)
以上代码会输出以下结果:
{'2021-01-01 to 2021-01-03': 45, '2021-01-04 to 2021-01-06': 90, '2021-01-07 to 2021-01-09': 135}
其中,键表示日期范围,值表示该范围内数据项的值的总和。在这个示例中,我们将日期范围分为3天一组,并计算了每个范围内值的总和。