以下是一个解决方法的代码示例,使用Python的pandas库来比较两个CSV文件的记录字段值的新增、删除和修改情况:
import pandas as pd
# 读取两个CSV文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 找出新增的记录
added_records = df2[~df2.isin(df1)].dropna()
# 找出删除的记录
deleted_records = df1[~df1.isin(df2)].dropna()
# 找出修改的记录
modified_records = df1[df1.isin(df2)].dropna()
# 输出结果
print("新增的记录:")
print(added_records)
print("\n删除的记录:")
print(deleted_records)
print("\n修改的记录:")
print(modified_records)
上述代码中,通过使用pandas的read_csv
函数读取两个CSV文件,并将它们保存为DataFrame对象df1
和df2
。然后,使用pandas的isin
函数比较两个DataFrame对象的记录,找出新增、删除和修改的记录。
~
操作符用于取反,~df2.isin(df1)
表示在df2中不在df1中的记录。dropna()
用于删除包含空值的行。
最后,输出新增、删除和修改的记录。
请确保将file1.csv
和file2.csv
替换为实际的CSV文件路径。