XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。

在易搜采集器中,我们用 XPath 来查找定位网页中的 Html 元素。 可以说 XPath 在采集器中是一个非常基础、非常重要的技术,在一些复杂的网页,可能需要手动 编写 XPath 表达式来解决问题。

具体的XPath知识,大家可用通过 http://www.w3school.com.cn/xpath/index.asp 来学习。


在易搜采集器中,列表模式手动设置分页字段中都是通过 XPath 来定位数据的。 都可以通过手动设置 XPath 来修改、完善 XPath 表达式

xpath

XPath可以填写多条,以作为补充、备用。

重要提示:当在列表模式时,字段的 XPath 需要是列表项的相对 XPath ,比如 ./div[1]/div[1]/span[1]

建议:如果手动编写 XPath ,尽量使用 class 来定位,比如 /div[@class='xxx']。相对于使用 /div[1] 索引这种方式更加稳定。