以下是一个示例代码,演示如何按ID在两个数据集之间匹配观察结果:
# 导入所需的库
import pandas as pd
# 创建第一个数据集
data1 = {'ID': [1, 2, 3, 4, 5],
'Value1': [10, 20, 30, 40, 50]}
df1 = pd.DataFrame(data1)
# 创建第二个数据集
data2 = {'ID': [2, 4, 6],
'Value2': [200, 400, 600]}
df2 = pd.DataFrame(data2)
# 使用merge函数按ID合并两个数据集
merged_df = pd.merge(df1, df2, on='ID', how='inner')
# 打印合并后的结果
print(merged_df)
输出结果为:
ID Value1 Value2
0 2 20 200
1 4 40 400
在上述示例中,我们首先导入了 pandas
库,然后创建了两个数据集 df1
和 df2
。然后使用 merge
函数按照ID列进行合并,并指定 how='inner'
以保留两个数据集中共有的ID。最后,我们打印了合并后的结果。