如何使用易搜采集器来采集中国制造供应商的数据?

第一步、我们首先需要去易搜采集软件官网下http://so.51soke.cn载软件

登陆软件后,我们点击新建任务;

当你想要采集一个网站数据时,首先需要找到一个展示数据列表的地址。 这一步,至关重要,起始网址决定了你采集的数据数量和类型。

以中国制造网英文站为例,我们想要抓取当前关键词里面的企业名称,联系人,企业号等等信息。

通过浏览网站,我们找到所有列表地址:https://www.made-in-china.com/company-search/tools/C1--CP_Guangdong/1.html

然后在蓝鲸可视化采集软件中新建任务->第一步->输入网页地址

然后点击下一步。

第二步、抓取数据

进入到第二步后,易搜采集软件会智能分析网页,并且从中提取出列表数据。 如下图:

这时,我们对已经分析出的数据进行整理修改, 比如删掉无用的字段。

点击列的下拉按钮,选择删除字段。

当然还是其他操作,比如修改名称,数据处理等等。这些我们将在后面的文档中介绍。

在整理修改字段后,我们来采集处理分页。

选择分页设置->自动识别分页,程序将会自动定位下一页元素。

完成之后,点击下一步。

第三步、设置

这里包括对浏览器的配置,比如禁用图片、禁用JS、禁用Flash、拦截广告等等操作。可以通过这些配置提高浏览器的加载速度。

计划任务的配置,通过计划任务,可以设置任务定时自动运行。

点击完成,保存任务。

 

评论0

请先

登入/注册
欢迎使用易搜网页数据采集软件
没有账号? 忘记密码?
豫ICP备18012411号-1  豫公网安备 44030502088897号