XPath:学习使用XPath语法提取HTML/XML文档中的数据使用语法

发布时间 2023-08-24 10:27:25作者: 小小绘

以下是一些XPath语法示例,用于提取HTML/XML文档中的数据:

  1. 选择元素:

    • 选择所有p元素://p
    • 选择根元素:/
  2. 属性匹配:

    • 选择class属性为"example"的div元素://div[@class='example']
  3. 文本内容提取:

    • 提取所有a元素的文本内容://a/text()
    • 提取第一个p元素的文本内容://p[1]/text()
  4. 使用逻辑运算符:

    • 选择同时具有class属性为"example"且id属性为"heading"的元素://*[@class='example' and @id='heading']
  5. 使用位置谓词:

    • 选择前三个li元素://li[position() <= 3]
    • 选择最后一个p元素://p[last()]
  6. 使用通配符:

    • 选择所有元素://*
    • 选择div元素下的任意子元素://div/*
  7. 使用轴:

    • 选择div元素的所有祖先元素://div/ancestor::*
    • 选择span元素之后的所有兄弟元素://span/following-sibling::*

以上只是XPath语法的一些示例,您可以根据实际需求进行组合和调整。使用XPath语法,您能够更精确地选择和提取HTML/XML文档中的数据。

本文由mdnice多平台发布