要比较两个Pandas数据框并返回不匹配的值,可以使用compare()
函数。
下面是一个示例代码:
import pandas as pd
# 创建两个数据框
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [1, 4, 3], 'B': ['a', 'd', 'c']})
# 比较两个数据框
diff = df1.compare(df2)
# 打印不匹配的值
print(diff)
输出:
A B
self other
1 2 d
在上面的示例中,我们首先创建了两个数据框df1
和df2
。然后,我们使用compare()
函数将两个数据框进行比较,并将结果存储在diff
变量中。最后,我们打印出diff
变量的值,即不匹配的值。
在输出中,self
列表示df1
中的值,other
列表示df2
中的值。如果两个数据框的值不匹配,则在相应的行中显示不匹配的值。在示例中,第一行的A
列中的值为2,在df1
中,而在df2
中的对应位置的值为4,因此该值被标记为不匹配。