取值属性

取值属性

首先,字段通过 XPath 定位查找到 Html 元素,然后我们就需要通过取值属性 来确定 Html 元素的哪个部分来作为字段值。

attr

一般情况下,采集器默认使用 InnerText 属性(当前节点以及其子节点的文本)

除了 InnerText,还有其他几个内置属性:

  1. Text ,表示当前节点的文本
  2. InnerHtml,表示当前节点内部的 HTML 语句(不包括当前节点)
  3. OuterHtml,表示当前节点的 HTML 语句

除了内置属性外,用户可以手动填写 HTML 属性。 常见的 HTML 属性比如 A标签的href,IMG标签的src。表示数据的data-*

*特别提示:这里是可以手动输入属性名称,即使下拉选项中没有。比如常见的onclick、value、class。

评论0

请先

登入/注册
欢迎使用易搜网页数据采集软件
没有账号? 忘记密码?
豫ICP备18012411号-1  豫公网安备 44030502088897号