本文介绍采集使用易搜采集金融保险数据(以平安车险采集为例)的方法。
采集网站:
http://baoxian.pingan.com/product/allbaoxianlist.shtml?PartnerId=4008
采集的内容包括:车险名称,车险价格
使用功能点:
l Ajax翻页【瀑布流翻页】
l 分页循环创建
步骤1:创建金融数据采集任务
进入主界面选择,选择自定义模式
将上面网址的网址复制粘贴到网站输入框中,点击“保存网址”
打开网页后,鼠标选中“健康保险”,在提示框中选择“更多操作”
接着选择“点击该元素”
步骤2:自动翻页
l 找到翻页按钮,设置翻页循环
l 设置ajax翻页时间
将页面下拉到底部,找到下一页按钮,鼠标点击,在右侧操作提示框中,选择“循环点击下一页”
步骤3:分页表格信息采集
l 选中需要采集的字段信息,创建采集列表
l 编辑采集字段名称
移动鼠标选中表格里任意一个保险信息,系统会识别出其他相似的元素,选择“选中全部”。
点击“采集以下链接文本”。
相似操作,选中一个保险起价,然后点击“选中全部”
点击“采集以下元素文本”
点开右上角的流程按钮,修改采集任务名、字段名,并点击下方提示中的“保存并开始采集”
由于页面使用了ajax加载技术,需要对点击元素及翻页步骤设置ajax延时加载(ajax判断方法:选择点击元素步骤,勾选【瀑布流】Ajax加载数据,选择合适的超时时间,一般设置2秒;最后点击确定
点击翻页步骤同样设置相同操作。最后再次选择保存并启动
根据采集的情况选择合适的采集方式,这里选择“开始采集”
步骤4:金融数据采集及导出
采集完成后,会跳出提示,选择导出数据。选择合适的导出方式,将采集好的数据导出。
请先
!