下面是一个比较两个CSV文件并将缺失的数据写入单独的CSV文件的解决方法的代码示例:
import pandas as pd
# 读取两个CSV文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 比较两个文件的差异
diff_df = df2[~df2.isin(df1)].dropna()
# 将差异数据写入单独的CSV文件
diff_df.to_csv('diff_file.csv', index=False)
在这个示例中,我们使用pandas库来处理CSV文件。首先,我们使用pd.read_csv()函数读取两个CSV文件,并将它们存储在df1和df2两个DataFrame对象中。
然后,我们使用~df2.isin(df1)来比较两个DataFrame对象的差异。这将返回一个布尔值的DataFrame对象,其中True表示数据在df2中存在但在df1中缺失。
接下来,我们使用dropna()函数删除含有缺失值的行,并将结果存储在diff_df中。
最后,我们使用to_csv()函数将diff_df写入一个单独的CSV文件diff_file.csv,并通过设置index=False参数来去除行索引。