下面是一个示例代码,用于比较N个文件的第一列,并打印匹配项的第一个文件和其他文件的第二列。
import pandas as pd
# 读取第一个文件
df1 = pd.read_csv('file1.csv')
# 创建一个字典,用于存储第一个文件的第一列和第二列的对应关系
dict1 = dict(zip(df1['col1'], df1['col2']))
# 循环遍历N-1个文件
for i in range(2, N+1):
# 读取第i个文件
dfi = pd.read_csv(f'file{i}.csv')
# 创建一个字典,用于存储第i个文件的第一列和第二列的对应关系
dicti = dict(zip(dfi['col1'], dfi['col2']))
# 比较第一个文件和第i个文件的第一列,并打印匹配项的第一个文件和第i个文件的第二列
for key in dict1.keys():
if key in dicti:
print(f'匹配项:{key},第一个文件的第二列:{dict1[key]},第{i}个文件的第二列:{dicti[key]}')
请替换示例代码中的文件名和列名,以适应你的实际情况。