使用 Python 的 difflib 模块来比较两个 HTML 文本。首先将两个 HTML 文本读入并转换成字符串对象,然后将它们转换成列表以便与 difflib 模块进行比较。最后,使用 HTML 标记来标记两个文本之间的不同之处。
代码示例:
from difflib import Differ, HtmlDiff
# 读入两个 HTML 文本并转换成字符串对象
with open('file1.html', 'r') as f1:
html1 = f1.read()
with open('file2.html', 'r') as f2:
html2 = f2.read()
# 转换成列表
lines1 = html1.splitlines()
lines2 = html2.splitlines()
# 使用 Differ 比较两个文本
d = Differ()
diff = list(d.compare(lines1, lines2))
# 使用 HtmlDiff 来标记差异,并将结果保存到 HTML 文件中
html_diff = HtmlDiff().make_file(lines1, lines2, context=True)
with open('diff.html', 'w') as f:
f.write(html_diff)
执行以上代码后,会生成一个名为“diff.html”的文件,其中包含两个 HTML 文本之间的不同之处,并用 HTML 标记来标记它们。