以下是一个示例代码,展示如何按照特定列分组合并来自不同列的结果:
import pandas as pd
# 创建示例数据
data1 = {'列A': ['A1', 'A2', 'A3', 'A4'],
'列B': ['B1', 'B2', 'B3', 'B4']}
data2 = {'列A': ['A1', 'A2', 'A3', 'A4'],
'列C': ['C1', 'C2', 'C3', 'C4']}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 按照'列A'列进行合并
df_merged = pd.merge(df1, df2, on='列A')
print(df_merged)
输出结果为:
列A 列B 列C
0 A1 B1 C1
1 A2 B2 C2
2 A3 B3 C3
3 A4 B4 C4
在示例代码中,我们首先导入了pandas
库。接下来,我们创建了两个示例数据集df1
和df2
,每个数据集包含一个共同的列'列A'。然后,我们使用pd.merge()
函数按照'列A'列进行合并,将两个数据集合并为一个新的数据集df_merged
。
使用pd.merge()
函数时,我们需要指定on
参数,该参数指定了用于合并的列。在这个示例中,我们将'列A'列作为合并的依据。合并后的结果将包含'列A'、'列B'和'列C'三列。
最后,我们打印输出了合并后的结果df_merged
。