假设有以下的数据表格:
Name Age
Amy 18
Bob 20
Cathy 18
Dave 22
Eva 20
现在需要按照年龄将人员分组,并将每个年龄组内的人员姓名以逗号连接起来。可以使用 pandas 库中的 groupby() 和 agg() 函数来实现。
代码如下:
import pandas as pd
# 读入数据
data = pd.read_csv('data.csv')
# 按照 Age 列分组,并且连接 Name 列
grouped = data.groupby('Age')['Name'].apply(lambda x: ','.join(x))
# 查看结果
print(grouped)
输出结果如下:
Age
18 Amy,Cathy
20 Bob,Eva
22 Dave
Name: Name, dtype: object
其中,apply() 函数接受一个函数作为参数,用来对分组后的每个组进行操作。这里使用 lambda 函数来将组内的姓名连接起来。
最终的结果是一个 Series,其中每个年龄和对应的姓名列表被连接成了一个字符串。