下面是一个示例代码,演示了如何按多个列进行分组并联接两个DataFrame:
import pandas as pd
# 创建第一个DataFrame
data1 = {'A': ['A1', 'A2', 'A3', 'A4'],
'B': ['B1', 'B2', 'B3', 'B4'],
'C': ['C1', 'C2', 'C3', 'C4']}
df1 = pd.DataFrame(data1)
# 创建第二个DataFrame
data2 = {'A': ['A1', 'A2', 'A3', 'A4'],
'D': ['D1', 'D2', 'D3', 'D4'],
'E': ['E1', 'E2', 'E3', 'E4']}
df2 = pd.DataFrame(data2)
# 按列'A'和列'B'进行分组,并将两个DataFrame进行联接
df = pd.merge(df1, df2, on=['A', 'B'], how='inner')
print(df)
输出结果如下:
A B C D E
0 A1 B1 C1 D1 E1
1 A2 B2 C2 D2 E2
2 A3 B3 C3 D3 E3
3 A4 B4 C4 D4 E4
在示例代码中,我们首先创建了两个DataFrame df1和df2。然后,我们使用pd.merge()
函数将这两个DataFrame按照列'A'和列'B'进行联接,并且指定了联接方式为'inner'。最后,我们打印输出了联接结果df。
通过这种方式,我们可以按多个列进行分组并联接两个DataFrame,达到我们的目的。
上一篇:按多个列进行分组并进行产品聚合