要比较CSV文件并将重复项返回到新的CSV文件中,您可以使用Python的pandas库来处理CSV文件。以下是一个示例代码,演示了如何比较两个CSV文件并将重复项写入新的CSV文件中:
import pandas as pd
# 读取第一个CSV文件
df1 = pd.read_csv('file1.csv')
# 读取第二个CSV文件
df2 = pd.read_csv('file2.csv')
# 比较两个CSV文件的重复项
duplicates = pd.merge(df1, df2, how='inner')
# 将重复项写入新的CSV文件
duplicates.to_csv('duplicates.csv', index=False)
在这个示例中,我们首先使用pd.read_csv()
函数读取两个CSV文件,并将它们存储在df1
和df2
变量中。然后,我们使用pd.merge()
函数将两个数据框合并,并指定how='inner'
参数来找到两个数据框的重复项。最后,我们使用to_csv()
函数将重复项写入新的CSV文件中,并指定index=False
来避免写入索引列。
请确保您已经安装了pandas库,可以使用pip install pandas
命令安装。