要比较两个CSV文件并创建一个新的CSV文件,可以使用以下步骤:
pandas
和numpy
。import pandas as pd
import numpy as np
read_csv()
函数读取两个CSV文件并将它们存储到两个不同的DataFrame中。df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
equals()
函数比较两个DataFrame是否相等。if df1.equals(df2):
print("两个CSV文件相等")
else:
print("两个CSV文件不相等")
merge()
函数将它们合并到一个新的DataFrame中。merged_df = pd.merge(df1, df2, on='key_column', how='outer')
to_csv()
函数将合并后的DataFrame保存到一个新的CSV文件中。merged_df.to_csv('merged_file.csv', index=False)
完整的代码示例:
import pandas as pd
import numpy as np
df1 = pd.read_csv('file1.csv')
df2 = pd.read_csv('file2.csv')
if df1.equals(df2):
print("两个CSV文件相等")
else:
merged_df = pd.merge(df1, df2, on='key_column', how='outer')
merged_df.to_csv('merged_file.csv', index=False)
print("创建了一个新的CSV文件:merged_file.csv")
请确保将代码中的file1.csv
和file2.csv
替换为你要比较的实际文件名,并将key_column
替换为用于比较的列名。
上一篇:比较两个CSV文件
下一篇:比较两个CSV文件并打印差异