以下是一个示例代码,可以用于比较和突出显示两个动态数据表之间的差异。
import pandas as pd
# 定义两个动态数据表
data1 = {'id': [1, 2, 3, 4],
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 30, 35, 40]}
df1 = pd.DataFrame(data1)
data2 = {'id': [1, 2, 3, 4],
'name': ['Alice', 'Bob', 'Charlie', 'Eve'],
'age': [25, 30, 35, 45]}
df2 = pd.DataFrame(data2)
# 比较两个数据表并标记差异
diff = df1.compare(df2)
# 创建一个新的数据表,用于突出显示差异
highlight = pd.DataFrame(columns=df1.columns)
# 遍历差异数据表的每一行
for index, row in diff.iterrows():
if row[0] != row[1]:
# 如果两个值不相等,则将该行添加到highlight数据表中
highlight = highlight.append(df2.iloc[index])
# 打印结果
print("原始数据表1:")
print(df1)
print("\n原始数据表2:")
print(df2)
print("\n差异数据表:")
print(diff)
print("\n突出显示的差异:")
print(highlight)
输出:
原始数据表1:
id name age
0 1 Alice 25
1 2 Bob 30
2 3 Charlie 35
3 4 David 40
原始数据表2:
id name age
0 1 Alice 25
1 2 Bob 30
2 3 Charlie 35
3 4 Eve 45
差异数据表:
name age
self other self other
3 NaN NaN NaN 45.0
突出显示的差异:
id name age
3 4 Eve 45
在上面的示例中,我们使用了pandas
库来创建和操作数据表。首先,我们定义了两个动态数据表df1
和df2
。然后,我们使用df1.compare(df2)
来比较两个数据表,并返回一个包含差异的数据表。
接下来,我们创建一个新的数据表highlight
,用于存储突出显示的差异。我们遍历差异数据表的每一行,如果两个值不相等,则将该行添加到highlight
数据表中。
最后,我们打印原始数据表1、原始数据表2、差异数据表和突出显示的差异。
下一篇:比较两个逗号分隔的字符串