以下是使用Python和BeautifulSoup库的一个示例代码,可以按照子节点的文本选择节点:
from bs4 import BeautifulSoup
# 创建一个示例HTML文档
html = '''
示例文档
第一个段落
第二个段落
'''
# 使用BeautifulSoup解析HTML文档
soup = BeautifulSoup(html, 'html.parser')
# 选择所有p标签的父节点
divs = soup.find_all('p')
# 遍历每个p标签的父节点,并输出其文本内容
for div in divs:
print(div.parent.text)
运行以上代码将输出:
第一个段落
第二个段落
以上代码中,我们首先创建了一个HTML文档字符串,然后使用BeautifulSoup库解析该文档。接下来,我们使用find_all
方法选择所有的p
标签,然后遍历每个p
标签的父节点,并使用text
属性获取父节点的文本内容。