可以使用Python中的pandas库来比较两个CSV文件,并找出额外的数据。可以按照以下步骤操作:
import pandas as pd
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
diff = df2[~df2.isin(df1)]
此代码将从df2中查找df1中不存在的行。
diff.to_csv('additional_data.csv', index=False)
此代码将结果保存到名为additional_data.csv的文件中。
完整的代码示例:
import pandas as pd
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
diff = df2[~df2.isin(df1)]
diff.to_csv('additional_data.csv', index=False)
这个方法可以快速地比较两个CSV文件,并找出额外的数据。
下一篇:比较两个长度不同的列