下面是一个使用Python的pandas库比较两个CSV文件并保持数据格式的示例代码:
import pandas as pd
# 读取第一个CSV文件
df1 = pd.read_csv('file1.csv', encoding='utf8')
# 读取第二个CSV文件
df2 = pd.read_csv('file2.csv', encoding='utf8')
# 比较两个DataFrame对象
comparison_result = df1.compare(df2)
# 将比较结果保存到CSV文件
comparison_result.to_csv('comparison_result.csv', encoding='utf8', index=False)
这段代码假设你已经安装了pandas库,并且将要比较的两个CSV文件分别命名为file1.csv
和file2.csv
。encoding='utf8'
用于指定文件的编码格式,确保正确读取数据。
read_csv()
函数用于读取CSV文件并将其转换为DataFrame对象。compare()
函数用于比较两个DataFrame对象,并返回一个新的DataFrame对象,其中包含不同的行以及它们的差异。最后,使用to_csv()
函数将比较结果保存到一个新的CSV文件中。index=False
参数用于不保存行索引。
你可以根据实际情况对代码进行修改,比如更改文件路径或名称,以适应你的需求。