下面是一个使用Python Pandas库比较两个具有相同列的表,并报告差异的示例代码:
import pandas as pd
# 创建两个示例表格
df1 = pd.DataFrame({'A': [1, 2, 3, 4, 5],
'B': ['a', 'b', 'c', 'd', 'e'],
'C': [0.1, 0.2, 0.3, 0.4, 0.5]})
df2 = pd.DataFrame({'A': [1, 2, 3, 4, 9],
'B': ['a', 'b', 'x', 'y', 'z'],
'C': [0.1, 0.2, 0.6, 0.4, 0.9]})
# 设置参考列
reference_column = 'A'
# 使用merge函数将两个表格根据参考列合并
merged_df = pd.merge(df1, df2, on=reference_column, suffixes=('_df1', '_df2'), how='outer')
# 检查每列的差异并报告
for column in merged_df.columns:
if column != reference_column:
diff = merged_df[column + '_df1'] != merged_df[column + '_df2']
diff_rows = merged_df[diff]
print(f"Differences in column '{column}':")
print(diff_rows)
print("\n")
以上代码将根据参考列'A'合并两个表格,并使用后缀'_df1'和'_df2'来区分来自两个表格的列。然后,通过对比每列的值,找到差异并报告。输出将显示每列的差异行。
请注意,这只是一个简单的示例,具体的实现方式可能会因数据的结构和需求的不同而有所变化。