要比较两个具有不同列名的Pandas数据帧并找到匹配项,可以按照以下步骤进行:
reindex
方法重新排列其中一个数据帧的列名,以匹配另一个数据帧的列名顺序。df2 = df2.reindex(columns=df1.columns)
merge
函数将两个数据帧合并在一起,并指定left_on
和right_on
参数为需要比较的列名。merged_df = pd.merge(df1, df2, left_on='column1', right_on='column2')
matched_rows = merged_df[['column1', 'column3']]
matched_rows = matched_rows.drop_duplicates()
完整的代码示例如下:
import pandas as pd
# 创建第一个数据帧
df1 = pd.DataFrame({'column1': [1, 2, 3], 'column2': [4, 5, 6]})
# 创建第二个数据帧
df2 = pd.DataFrame({'column2': [4, 6, 8], 'column3': ['a', 'b', 'c']})
# 重新排列第二个数据帧的列名
df2 = df2.reindex(columns=df1.columns)
# 合并两个数据帧
merged_df = pd.merge(df1, df2, left_on='column1', right_on='column2')
# 筛选出匹配的行
matched_rows = merged_df[['column1', 'column3']]
matched_rows = matched_rows.drop_duplicates()
print(matched_rows)
输出结果为:
column1 column3
0 1 a
2 3 c
下一篇:比较两个具有不同值的表格