下面是一个比较两个CSV文件并将缺失的数据写入单独的CSV文件的解决方法的代码示例:
import pandas as pd
# 读取两个CSV文件
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
# 比较两个文件的差异
diff_df = df2[~df2.isin(df1)].dropna()
# 将差异数据写入单独的CSV文件
diff_df.to_csv('diff_file.csv', index=False)
在这个示例中,我们使用pandas库来处理CSV文件。首先,我们使用pd.read_csv()
函数读取两个CSV文件,并将它们存储在df1
和df2
两个DataFrame对象中。
然后,我们使用~df2.isin(df1)
来比较两个DataFrame对象的差异。这将返回一个布尔值的DataFrame对象,其中True
表示数据在df2
中存在但在df1
中缺失。
接下来,我们使用dropna()
函数删除含有缺失值的行,并将结果存储在diff_df
中。
最后,我们使用to_csv()
函数将diff_df
写入一个单独的CSV文件diff_file.csv
,并通过设置index=False
参数来去除行索引。