Adblock规则中提取域名的正则表达式_编程开发

Adblock规则中提取域名的正则表达式

创始人

2024-07-26 02:30:31

0次

要从Adblock规则中提取域名，可以使用正则表达式来匹配规则中的域名部分。以下是一个示例解决方案的代码示例：

import re

def extract_domain(rule):
    # 定义匹配规则的正则表达式
    pattern = r"(\|\|)?([^\^\/\|\$]+)\^?\$?.*"

    # 使用正则表达式匹配规则中的域名部分
    match = re.match(pattern, rule)

    # 提取匹配结果中的域名部分
    if match:
        domain = match.group(2)
        return domain

    return None

# 测试示例
rule1 = "||example.com^$third-party"
rule2 = "example.org"
rule3 = "||example.net^$script"
print(extract_domain(rule1))  # 输出: example.com
print(extract_domain(rule2))  # 输出: example.org
print(extract_domain(rule3))  # 输出: example.net

在上述代码中，我们使用了正则表达式(\|\|)?([^\^\/\|\$]+)\^?\$?.*来匹配Adblock规则中的域名部分。这个正则表达式的含义是：

(\|\|)?：匹配可选的||前缀。
([^\^\/\|\$]+)：匹配不包含^、/、|和$的任意字符，即域名部分。
\^?\$?：匹配可选的^和$后缀。
.*：匹配剩余的任意字符（如果有）。

然后，我们定义了一个extract_domain函数，它接受一个Adblock规则作为输入，并使用re.match函数来进行匹配。如果匹配成功，则提取匹配结果中的第二个匹配组，即域名部分。最后，我们测试了一些示例规则，并输出了提取到的域名部分。

请注意，这只是一个简单的示例解决方案，对于复杂的Adblock规则，可能需要根据实际情况进行适当的调整。

上一篇：Adblocker阻止XMLHttpRequest

下一篇：AdBlock认为我的WebSocket请求是广告

Adblock规则中提取域名的正则表达式

相关内容

热门资讯