以下是一个示例脚本,可以在段落中找到并标记相同的单词:
import re
def highlight_same_words(paragraph):
# 使用正则表达式匹配单词
pattern = re.compile(r'\b(\w+)\b')
words = pattern.findall(paragraph)
# 找到重复的单词
duplicates = set([word for word in words if words.count(word) > 1])
# 标记重复的单词
for word in duplicates:
paragraph = re.sub(r'\b({})\b'.format(word), r'\1', paragraph)
return paragraph
# 测试脚本
paragraph = "编写一个脚本,可以在段落中找到并标记相同的单词。这个脚本可以用于任何文本段落。"
highlighted_paragraph = highlight_same_words(paragraph)
print(highlighted_paragraph)
运行上述代码,输出结果为:
编写一个脚本,可以在段落中找到并标记相同的单词。这个脚本可以用于任何文本段落。