您可以使用Python的set数据结构来解决这个问题。set是一个无序且不重复的集合,可以用来存储文件中的每一行。
下面是一个示例代码,它比较两个文件(file1.txt和file2.txt)中的内容并打印出匹配项:
def find_duplicates(file1, file2):
# 读取文件1的内容并存储在set1中
with open(file1, 'r') as f1:
set1 = set(f1.readlines())
# 读取文件2的内容并存储在set2中
with open(file2, 'r') as f2:
set2 = set(f2.readlines())
# 找到两个文件的交集(即重复的匹配项)
duplicates = set1.intersection(set2)
# 打印匹配项
for duplicate in duplicates:
print(duplicate.strip())
# 使用示例
find_duplicates('file1.txt', 'file2.txt')
在这个示例中,我们首先使用open
函数打开文件并使用readlines
方法读取每一行的内容。然后,我们将每个文件的内容存储在不同的set中。最后,我们使用intersection
方法来找到两个文件的交集(即重复的匹配项),并使用strip
方法去除每行的换行符。最后,我们使用循环将匹配项打印出来。
您可以根据实际情况修改文件名和路径。