XPath 是一门在 XML 文档中查找信息的语言。XPath 用于在 XML 文档中通过元素和属性进行导航。
在易搜采集器中,我们用 XPath 来查找定位网页中的 Html 元素。 可以说 XPath 在采集器中是一个非常基础、非常重要的技术,在一些复杂的网页,可能需要手动 编写 XPath 表达式来解决问题。
具体的XPath知识,大家可用通过 http://www.w3school.com.cn/xpath/index.asp 来学习。
在易搜采集器中,列表模式
、手动设置分页
、字段
中都是通过 XPath 来定位数据的。 都可以通过手动设置 XPath
来修改、完善 XPath 表达式
XPath可以填写多条,以作为补充、备用。
重要提示:当在列表模式
时,字段的 XPath 需要是列表项的相对 XPath ,比如 ./div[1]/div[1]/span[1]
建议:如果手动编写 XPath ,尽量使用 class 来定位,比如 /div[@class='xxx']
。相对于使用 /div[1]
索引这种方式更加稳定。
请先
!