以下是一个示例代码,用于按共享子数组值将数据集分组到多维数组中,并将累积值推入组的一列:
def group_and_accumulate(data, shared_keys, accumulate_key):
groups = {}
for item in data:
group_key = tuple(item[key] for key in shared_keys)
if group_key not in groups:
groups[group_key] = []
groups[group_key].append(item[accumulate_key])
result = []
for group_key, values in groups.items():
accumulate_value = sum(values)
result.append(list(group_key) + [accumulate_value])
return result
# 示例数据集
data = [
{'group': 'A', 'subgroup': 'X', 'value': 1},
{'group': 'A', 'subgroup': 'X', 'value': 2},
{'group': 'A', 'subgroup': 'Y', 'value': 3},
{'group': 'B', 'subgroup': 'X', 'value': 4},
{'group': 'B', 'subgroup': 'Y', 'value': 5},
]
# 按共享键 group 和 subgroup 分组,并累积值 value
result = group_and_accumulate(data, ['group', 'subgroup'], 'value')
print(result)
输出结果为:
[['A', 'X', 3], ['A', 'Y', 3], ['B', 'X', 4], ['B', 'Y', 5]]
在示例中,首先定义了一个 group_and_accumulate
函数,该函数接受三个参数:数据集 data
、共享键列表 shared_keys
和累积键 accumulate_key
。
函数内部首先创建一个空字典 groups
,用于存储分组后的数据。然后遍历数据集中的每个项,根据共享键构造一个组合键 group_key
,如果该组合键在字典中不存在,则将其初始化为空列表。然后将累积键对应的值添加到该组合键对应的列表中。
接下来,创建一个空列表 result
,用于存储最终的结果。遍历字典中的每个组合键和对应的值列表,计算累积值并将其添加到组合键的列表中。最后,将组合键和累积值的列表添加到结果列表中。
最后,调用示例数据集进行测试,将共享键设置为 ['group', 'subgroup']
,将累积键设置为 'value'
,得到的结果就是按共享子数组值分组并累积的多维数组。
上一篇:按共享元素对列表的群组列表
下一篇:按供应商计算订单导致SQL错误