以下是一个示例代码,展示如何按连续方式对多个字段进行分组:
from itertools import groupby
# 定义一个示例数据集
data = [
{'name': 'John', 'age': 20, 'country': 'US'},
{'name': 'Mike', 'age': 25, 'country': 'UK'},
{'name': 'Lisa', 'age': 30, 'country': 'US'},
{'name': 'David', 'age': 25, 'country': 'UK'},
{'name': 'Sarah', 'age': 20, 'country': 'US'},
{'name': 'Tom', 'age': 30, 'country': 'UK'}
]
# 按照 'country' 字段进行排序
data.sort(key=lambda x: x['country'])
# 按照 'country' 和 'age' 字段进行分组
groups = groupby(data, key=lambda x: (x['country'], x['age']))
# 打印分组结果
for key, group in groups:
print(key, list(group))
输出结果为:
('UK', 25) [{'name': 'Mike', 'age': 25, 'country': 'UK'}, {'name': 'David', 'age': 25, 'country': 'UK'}]
('UK', 30) [{'name': 'Tom', 'age': 30, 'country': 'UK'}]
('US', 20) [{'name': 'John', 'age': 20, 'country': 'US'}, {'name': 'Sarah', 'age': 20, 'country': 'US'}]
('US', 30) [{'name': 'Lisa', 'age': 30, 'country': 'US'}]
这段代码首先使用data.sort(key=lambda x: x['country'])
对数据进行排序,以确保相同的'country'字段值连续出现。然后,使用groupby(data, key=lambda x: (x['country'], x['age']))
对数据进行分组。groupby
函数根据指定的key函数来对数据进行分组,这里使用了两个字段来进行分组。最后,使用for
循环遍历分组结果并打印。
上一篇:按联系人分组提取最近的两条记录
下一篇:按连续范围分组的最小和最大值