以下是一个Python的代码示例,用于比较两个数据框并保留特定行中匹配的列:
import pandas as pd
# 创建第一个数据框
data1 = {'Name': ['Tom', 'Nick', 'John', 'Alice'],
'Age': [20, 21, 19, 22],
'City': ['New York', 'Paris', 'London', 'Tokyo']}
df1 = pd.DataFrame(data1)
# 创建第二个数据框
data2 = {'Name': ['Tom', 'John', 'Alice', 'Mike'],
'Salary': [5000, 6000, 5500, 7000],
'City': ['New York', 'London', 'Tokyo', 'Sydney']}
df2 = pd.DataFrame(data2)
# 使用merge函数比较并保留匹配的行和列
df_merged = df1.merge(df2, on=['Name', 'City'], how='inner')
# 输出结果
print(df_merged)
运行以上代码,将输出如下结果:
Name Age City Salary
0 Tom 20 New York 5000
1 John 19 London 6000
2 Alice 22 Tokyo 5500
在这个例子中,我们使用了merge
函数来比较两个数据框df1
和df2
。on=['Name', 'City']
指定了要比较的列,how='inner'
表示只保留匹配的行。最后,将结果保存在df_merged
中,并打印输出。
下一篇:比较两个数据框并创建新值