from lxml import etree
# 示例HTML内容
html_content = """
<div>
<a href="link1.html">Link 1</a>
<a href="link2.html">Link 2</a>
<a href="link3.html">Link 3</a>
</div>
"""
# 将字符串解析为HTML
tree = etree.HTML(html_content)
# 使用XPath查找所有<a>标签的href属性
links = tree.xpath("//a/@href")
# 输出结果
print(links)
lxml 库中的 etree 模块来解析和处理HTML内容。<a> 标签。etree.HTML() 方法将字符串解析为HTML对象。xpath("//a/@href") 查找所有 <a> 标签的 href 属性。如果你需要更复杂的XPath查询或有其他问题,请告诉我!
上一篇:python中[ ]
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站