可以使用Python的pandas库来处理CSV文件,具体步骤如下:
首先使用pandas的read_csv()函数将两个CSV文件读取为dataframe格式。
对dataframe进行操作,使用pandas中merge()函数将两个dataframe合并,合并基准为前两列。
设置循环遍历dataframe的每一行,如果前两列匹配,则询问用户是否覆盖此行数据,如果用户选择覆盖,则将对应的行数据修改后合并回原dataframe中,否则不做处理。
循环结束后,将最终结果保存到新的CSV文件中。
以下是代码示例:
import pandas as pd
# 读取CSV文件1
df1 = pd.read_csv('file1.csv')
# 读取CSV文件2
df2 = pd.read_csv('file2.csv')
# 合并两个dataframe
merge_df = pd.merge(df1, df2, on=['column1', 'column2'])
# 遍历merge_df每一行
for idx, row in merge_df.iterrows():
# 如果前两列匹配
if row['column1'] == row['column2']:
# 询问用户是否覆盖
decision = input(f"Do you want to override row {idx}? (y/n)")
if decision == 'y':
# 修改对应行数据
merge_df.loc[idx, 'column3'] = 'new value'
else:
# 不做处理
pass
# 将最终结果保存到新的CSV文件
merge_df.to_csv('output.csv', index=False)
上一篇:比较两个CSV文件并打印差异