JSON数据采集

JSON数据采集

使用易搜采集软件可以采集JSON格式数据,使用JSON引擎可以大大提高采集效率,并且JSON格式数据一般不需要二次处理,数据干净、整洁。

如何采集JSON数据?

前提,一般需要通过浏览器抓包找到JSON数据的请求地址(URL),用浏览器自带的调试工具(F12)或者Fiddler都可以实现抓包。

首先,在蓝鲸可视化采集软件中,新建任务,把找到JSON的请求地址复制到起始地址中。 JSON

JSON

然后,点击下一步进入到抓取数据页,设置引擎为JSON引擎

如果要抓取的JSON数据是一个列表,则设置模式为列表模式。 在列表模式下,我们点击选择列表。 JSON

JSON

然后,添加字段,点击需要抓取的一个属性节点。

以此类推,新建其他字段。

JSON的头信息验证

在部分JSON请求中,Http header中会有一些验证信息,比如Authorization,必须要加上这些头信息才能获取到数据。 先通过抓包工具获取,然后在复制到采集器中。 JSON

JSON的分页采集

一般JSON请求的分页参数都是在请求地址中,类似参数如page,pn,p,通过抓取工具可以分析得到。 在通过分析出分页参数的构成后,我们在第一步中,来通过采集器中的批量生成网址来构建分页请求。

 

JSON

评论0

请先

登入/注册
欢迎使用易搜网页数据采集软件
没有账号? 忘记密码?
豫ICP备18012411号-1  豫公网安备 44030502088897号