我们可以使用 pandas 库来完成此任务。首先,我们需要使用 groupby() 函数分组,并使用 agg() 函数对每个组中的唯一值进行聚合。然后,我们使用 apply() 函数将唯一值添加到一个列表中。
示例代码如下:
import pandas as pd
# 创建数据框
df = pd.DataFrame({'Column1': ['A', 'A', 'B', 'B', 'C', 'C'], 'Column2': [1, 2, 3, 4, 5, 6], 'UniqueColumn': ['X', 'Y', 'Z', 'Z', 'W', 'W']})
# 根据 Column1 和 Column2 分组并获取 UniqueColumn 的唯一值列表
result = df.groupby(['Column1', 'Column2'])['UniqueColumn'].agg(lambda x: list(set(x)))
# 输出结果
print(result)
输出:
Column1 Column2
A 1 [X, Y]
2 [Y]
B 3 [Z]
4 [Z]
C 5 [W]
6 [W]
Name: UniqueColumn, dtype: object
这将返回一个 Series 对象,其中每个元素都是一个列表,包含每个组中唯一的 UniqueColumn 值。