以下是一个Python代码示例,用于比较两个CSV文件的多个列,并将匹配和不匹配的结果保存为新的CSV文件:
import pandas as pd
# 读取第一个CSV文件
df1 = pd.read_csv('file1.csv')
# 读取第二个CSV文件
df2 = pd.read_csv('file2.csv')
# 指定需要比较的列
compare_cols = ['column1', 'column2', 'column3']
# 比较两个CSV文件的指定列
df_merged = pd.merge(df1, df2, on=compare_cols, how='outer', suffixes=('_file1', '_file2'))
# 创建匹配的新CSV文件
df_matched = df_merged.dropna(subset=[col+"_file1" for col in compare_cols])
df_matched.to_csv('matched.csv', index=False)
# 创建不匹配的新CSV文件
df_unmatched = df_merged[df_merged.isnull().any(axis=1)]
df_unmatched.to_csv('unmatched.csv', index=False)
请确保将file1.csv
和file2.csv
替换为实际的文件路径。在上面的示例中,假设CSV文件中的列名为column1
,column2
和column3
。您可以根据实际情况调整这些列名。