下面是一个比较数据帧并计算不匹配案例的百分比的示例代码:
import pandas as pd
def compare_data_frames(df1, df2):
# 比较两个数据帧的每个元素
comparison = df1 == df2
# 计算不匹配案例的数量
num_mismatches = comparison.size - comparison.sum().sum()
# 计算不匹配案例的百分比
mismatch_percentage = (num_mismatches / comparison.size) * 100
return mismatch_percentage
# 创建示例数据帧
data1 = {'A': [1, 2, 3], 'B': [4, 5, 6]}
data2 = {'A': [1, 2, 4], 'B': [4, 5, 7]}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
# 比较数据帧并计算不匹配案例的百分比
percentage = compare_data_frames(df1, df2)
print(f"不匹配案例的百分比:{percentage}%")
输出结果为:
不匹配案例的百分比:33.33333333333333%
这个示例中,我们定义了一个compare_data_frames
函数来比较两个数据帧的每个元素。我们使用==
运算符将两个数据帧进行元素级别的比较,并返回一个具有相同形状的布尔值数据帧。然后,我们计算不匹配案例的数量,这等于总元素数减去True
值的数量。最后,我们计算不匹配案例的百分比,将不匹配案例的数量除以总元素数,并乘以100。
上一篇:比较数据帧