你可以使用Pandas库来实现按多列聚合、求和并保留其他列的操作。以下是一个示例代码:
import pandas as pd
# 创建示例数据
data = {'列A': ['A', 'B', 'A', 'B', 'A'],
'列B': [1, 2, 3, 4, 5],
'列C': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 按列A进行聚合求和并保留列B和列C
df_agg = df.groupby('列A').agg({'列B': 'sum', '列C': 'sum'}).reset_index()
# 基于聚合值创建新列
df_agg['新列'] = df_agg['列B'] + df_agg['列C']
print(df_agg)
输出结果如下:
列A 列B 列C 新列
0 A 9 90 99
1 B 6 60 66
在代码中,首先使用groupby
方法按列A进行分组。然后使用agg
方法指定需要对哪些列进行聚合操作,这里选择对列B和列C进行求和。reset_index
方法用于重置索引。最后,使用['列B'] + ['列C']
的方式,将列B和列C的聚合值相加,创建了一个新的列。