在Python中,我们可以使用defaultdict
来解决按照数据中不存在的键返回分组的问题。defaultdict
是collections
模块中的一个数据结构,它是一个字典,但是在访问不存在的键时会自动创建默认值。
下面是一个示例代码:
from collections import defaultdict
# 原始数据
data = [
{'name': 'Alice', 'age': 25},
{'name': 'Bob', 'age': 30},
{'name': 'Charlie', 'age': 25},
{'name': 'Dave', 'age': 30},
{'name': 'Eve', 'age': 25}
]
# 创建一个默认值为列表的defaultdict
grouped_data = defaultdict(list)
# 按照年龄分组
for d in data:
age = d['age']
grouped_data[age].append(d)
# 打印分组结果
for age, group in grouped_data.items():
print(f'Age: {age}')
for person in group:
print(f'- {person}')
print()
输出结果如下:
Age: 25
- {'name': 'Alice', 'age': 25}
- {'name': 'Charlie', 'age': 25}
- {'name': 'Eve', 'age': 25}
Age: 30
- {'name': 'Bob', 'age': 30}
- {'name': 'Dave', 'age': 30}
在这个示例中,我们使用defaultdict(list)
创建了一个默认值为列表的字典grouped_data
。然后,我们遍历原始数据,按照年龄将每个人分组,并将每个人的信息添加到对应年龄的列表中。最后,我们打印了分组结果。
使用defaultdict
可以确保在访问不存在的键时不会引发KeyError
异常,而是返回一个空列表作为默认值。这样,我们可以方便地按照数据中不存在的键进行分组。