要比较数据框的列并返回差异,可以使用以下步骤和代码示例:
import pandas as pd
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [1, 2, 4], 'B': [4, 5, 7]})
compare()
函数比较两个数据框的列,并返回差异:diff = df1.compare(df2)
print(diff)
完整的代码示例:
import pandas as pd
# 创建两个数据框
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [1, 2, 4], 'B': [4, 5, 7]})
# 比较数据框的列并返回差异
diff = df1.compare(df2)
# 查看返回的差异结果
print(diff)
运行代码后,会输出两个数据框之间的差异结果。差异的表示方式是以元组的形式显示,其中包含三个元素:列名、索引和差异的值。例如,如果df1和df2的'A'列在第2行有差异,差异结果会显示为:('A', 2, [3, 4])
。
上一篇:比较数据框的两列并创建一个新列
下一篇:比较数据框的每一行中的两个列。