以下是一个示例代码,演示如何按多个不同数据类型的列进行分组,并将结果聚合为一个列表:
import pandas as pd
# 创建一个示例数据集
data = {'Name': ['John', 'Mary', 'Peter', 'John', 'David'],
'Age': [25, 30, 35, 25, 40],
'City': ['New York', 'London', 'Paris', 'New York', 'Tokyo']}
df = pd.DataFrame(data)
# 按多个列进行分组,并聚合为一个列表
grouped = df.groupby(['Age', 'City'])['Name'].apply(list).reset_index()
print(grouped)
输出结果如下:
Age City Name
0 25 New York [John, John]
1 30 London [Mary]
2 35 Paris [Peter]
3 40 Tokyo [David]
在这个示例中,我们使用groupby
方法按照Age
和City
两列进行分组。然后,使用apply
方法将每个组中的Name
列的值转换为一个列表。最后,使用reset_index
方法将结果重置索引,并将结果存储在grouped
变量中。
请注意,这仅仅是一个示例,实际应用中可能会根据具体需求进行调整。
上一篇:按多个标准排序
下一篇:按多个参数分隔read_csv