在Python中,可以使用pandas库来实现按多列进行分组和求和。下面是一个示例代码:
import pandas as pd
# 创建一个示例数据集
data = {'A': ['A1', 'A2', 'A1', 'A2', 'A1'],
'B': ['B1', 'B1', 'B2', 'B2', 'B1'],
'C': [1, 2, 3, 4, 5],
'D': [6, 7, 8, 9, 10]}
df = pd.DataFrame(data)
# 按列A和列B进行分组,并求和列C和列D
grouped = df.groupby(['A', 'B']).sum()
print(grouped)
运行结果如下:
C D
A B
A1 B1 6 16
B2 3 8
A2 B1 2 16
B2 4 9
在这个示例中,我们首先创建了一个包含'A'、'B'、'C'和'D'列的DataFrame。然后,我们使用groupby()
方法按'A'和'B'列进行分组,并使用sum()
方法求和'C'和'D'列。最后,打印出分组和求和后的结果。
上一篇:按多列进行分组和聚合
下一篇:按多列进行排序和分组