以下是使用XPath选择表格单元格的示例代码:
from lxml import etree
# 创建一个示例HTML表格
html = '''
姓名
年龄
性别
张三
25
男
李四
30
女
王五
28
男
'''
# 解析HTML
tree = etree.HTML(html)
# 通过XPath选择表格单元格
rows = tree.xpath('//table/tr')
for row in rows:
cols = row.xpath('td')
for col in cols:
print(col.text)
# 通过XPath选择表格列
cols = tree.xpath('//table/tr/td[2]')
for col in cols:
print(col.text)
运行上述代码将输出表格的单元格内容和第二列的内容。
上一篇:按列和行计数进行分组的时间序列图