要比较两个CSV文件并输出变化,可以使用Python的pandas库。下面是一个示例代码:
import pandas as pd
# 读取两个CSV文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 比较两个数据框的差异
diff = df1.merge(df2, indicator=True, how='outer')
diff = diff[diff['_merge'] != 'both']
# 输出变化
print(diff)
在这个示例中,我们首先使用pandas的read_csv
函数读取两个CSV文件并将它们存储为两个数据框(DataFrame)。然后,我们使用merge
函数将两个数据框进行合并,并使用indicator=True
参数添加一个特殊的列来标记合并的结果。接着,我们筛选出只有在一个文件中存在的行,并将结果存储在diff
变量中。最后,我们使用print
函数输出变化的内容。
请注意,这个示例只比较了两个文件的行级别差异。如果你还想比较列级别的差异,可以使用pandas的其他函数,如diff
、equals
等。