有两种解决方法可以处理这个问题。
方法一:使用.apply()
方法逐列应用函数
df = df.apply(lambda x: ','.join(x.unique()))
这种方法会逐列应用lambda
函数,将每列中不重复的值用逗号连接起来。注意,这种方法会修改原始数据框。
方法二:使用.agg()
方法并选择具体的列
df = df.agg(lambda x: ','.join(x.unique()), axis=0)
这种方法会在指定的列上应用lambda
函数,将每列中不重复的值用逗号连接起来。注意,axis=0
表示按列应用函数。
这两种方法都可以实现将每列中不重复的值用逗号连接起来,并返回一个包含所有列的新数据框。