可以使用pandas库来读取CSV文件,将其转换为一个DataFrame对象,然后就可以轻松地进行比较。
以下是一个示例代码,用于读取一个CSV文件,并提取其中的两列作为数组,然后与另一个CSV文件的两列数据进行比较。
import pandas as pd
# 读取第一个CSV文件
df1 = pd.read_csv('file1.csv')
# 提取第一个CSV文件的两列数据
column_name_1 = 'column1'
column_name_2 = 'column2'
arr1 = df1[[column_name_1, column_name_2]].values
# 读取第二个CSV文件
df2 = pd.read_csv('file2.csv')
# 提取第二个CSV文件的两列数据
column_name_3 = 'column3'
column_name_4 = 'column4'
arr2 = df2[[column_name_3, column_name_4]].values
# 进行比较
if (arr1 == arr2).all():
print("两个CSV文件的两列数据相同!")
else:
print("两个CSV文件的两列数据不同!")
上述代码中,我们使用了read_csv()函数读取了两个CSV文件,并使用了values属性,提取出特定列的数据。再将两个数组进行比较,如果相同则输出“两个CSV文件的两列数据相同!”,否则输出“两个CSV文件的两列数据不同!”。
上一篇:比较CSV文件中的两列