以下是一个示例代码,用于比较特定列的行,并在特定列的行匹配时合并其他列:
import pandas as pd
# 创建示例数据
data = {'列1': [1, 2, 3, 4, 5],
'列2': ['A', 'B', 'C', 'D', 'E'],
'特定列': ['X', 'Y', 'X', 'Y', 'X'],
'合并列': ['合并1', '合并2', '合并3', '合并4', '合并5']}
df = pd.DataFrame(data)
# 比较特定列的行并合并其他列
merged_data = df.groupby('特定列').agg({'列1': 'sum', '列2': 'first', '合并列': ', '.join}).reset_index()
# 打印合并后的数据
print(merged_data)
上述代码中,我们使用pandas库创建了一个DataFrame,并给出了示例数据。然后,我们使用groupby
函数对特定列进行分组。在agg
函数中,我们指定了要应用于每个组的聚合函数。在这种情况下,我们将“列1”的值求和,选择每个组的第一个值作为“列2”的值,然后将“合并列”的值用逗号分隔合并起来。最后,我们使用reset_index
函数重置索引,并将结果保存在merged_data
中。
运行代码后,将会打印出合并后的数据,其中特定列的行已经合并了其他列的值。