要比较两个数据框的列以获取匹配百分比,可以使用Python的pandas库。以下是一个代码示例:
import pandas as pd
# 创建两个示例数据框
df1 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e']})
df2 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'x', 'c', 'y', 'e']})
# 比较两个数据框的列并计算匹配百分比
match_percentage = df1.equals(df2)
if match_percentage:
percentage = 100
else:
percentage = df1.eq(df2).mean().mean() * 100
print(f"匹配百分比: {percentage}%")
在上述示例中,我们首先创建了两个示例数据框df1
和df2
,它们具有相同的列A
和B
,但是在第二个数据框中,列B
有两个不同的值。
然后,我们使用equals()
函数比较两个数据框是否完全相同,如果完全相同则匹配百分比为100%。如果两个数据框不完全相同,我们使用eq()
函数来比较每个单元格,并计算匹配的百分比。最后,我们打印出匹配百分比。
请注意,此方法假设两个数据框具有相同的形状和列名。如果数据框的结构不同,可能需要进行适当的数据清洗和预处理。