要比较两个数据帧之间环境的影响,可以使用以下代码示例:
import pandas as pd
# 创建两个示例数据帧
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'A': [6, 7, 8], 'B': [9, 10, 11]})
# 比较两个数据帧之间的值
comparison = df1 == df2
# 找出不同的值
diff = pd.concat([df1.mask(comparison), df2.mask(comparison)], keys=['df1', 'df2'])
print(diff)
输出:
A B
df1 1 4.0
df2 6 11.0
上述代码创建了两个示例数据帧df1和df2。然后,通过比较两个数据帧的值,创建了一个布尔类型的数据帧comparison,其中相同的位置为True,不同的位置为False。
接下来,使用mask()
函数找出不同的值,并使用concat()
函数将两个数据帧合并成一个新的数据帧diff,其中不同值所在的位置会被填充为NaN,并添加了索引键'df1'和'df2'来表示不同值来自哪个数据帧。
这样,我们就可以通过diff数据帧来查看两个数据帧之间的差异。