假设我们有一个数据表,其中包含两列,分别是"姓名"和"年龄"。我们想要按照"年龄"列进行分组,并将每个分组中的"姓名"列以列表的形式选择出来。
以下是一个示例代码,使用pandas库实现了按列分组并将其他列以列表形式选择的功能:
import pandas as pd
# 创建示例数据表
data = {'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'年龄': [18, 22, 20, 22, 18]}
df = pd.DataFrame(data)
# 按照"年龄"列进行分组,并将每个分组中的"姓名"列以列表的形式选择出来
grouped = df.groupby('年龄')['姓名'].apply(list)
print(grouped)
输出结果为:
年龄
18 [张三, 钱七]
20 [王五]
22 [李四, 赵六]
Name: 姓名, dtype: object
以上代码首先创建了一个示例数据表,然后使用groupby
方法按照"年龄"列进行分组。接着,使用apply
方法对每个分组中的"姓名"列应用list
函数,将"姓名"列转换为列表形式。最后,将分组结果打印出来。
上一篇:按列分组并忽略空格和特殊字符?