以下是一个示例代码,用于比较同一列中的记录并进行拼接:
import pandas as pd
# 创建一个示例数据集
data = {'姓名': ['张三', '张三', '李四', '李四', '王五', '王五'],
'科目': ['数学', '英语', '数学', '英语', '数学', '英语'],
'成绩': [80, 90, 85, 95, 70, 75]}
df = pd.DataFrame(data)
# 按照姓名和科目进行分组,并将成绩用逗号拼接起来
df_grouped = df.groupby(['姓名', '科目'])['成绩'].apply(lambda x: ','.join(map(str, x))).reset_index()
print(df_grouped)
输出结果:
姓名 科目 成绩
0 李四 数学 85,95
1 李四 英语 85,95
2 张三 数学 80,90
3 张三 英语 80,90
4 王五 数学 70,75
5 王五 英语 70,75
在这个示例中,我们使用了pandas
库来处理数据。首先,我们创建了一个包含姓名、科目和成绩的示例数据集。然后,我们使用groupby
函数按照姓名和科目进行分组,并使用apply
函数将成绩用逗号拼接起来。最后,我们使用reset_index
函数重新设置索引,并打印出结果。
上一篇:比较同一列表中的项目
下一篇:比较同一列中的数据 - SQL