结构化数据

组件介绍

在网页或者桌面程序中批量抓取相似元素的数据,包括列表、表格等,同时支持抓取多页数据。

截图

属性说明

必填项
属性名称 类型 默认值 说明
目标元素 元素 使用元素探测抓取到的信息,可能是表格,也可能是列表
选填项
属性名称 类型 默认值 说明
获取条数 数字 0 必须是整数,0 代表获取当前页所有符合条件的元素数据,
如果目标是列表元素,会自动填写符合条件的元素数据数量
数据分页 下拉选项 单页 ● 单页
● 多页
下一页 元素 数据分页选择「多页」时生效,需要指定下一页按钮的元素信息
点击方式 下拉选项 模拟鼠标 下一页选择元素后生效
● 自动化接口:使用系统自带的自动化点击接口,在某些位置可能不生效
● 模拟鼠标:模拟鼠标进行点击,当自动化接口不生效时可以尝试此方式,会移动鼠标位置
● 系统消息:使用系统发送消息到窗口的方式,多用于网页
获取页数 数字 0 数据分页选择「多页」时生效,需要获取数据的页数
0 默认为一直点击下一页元素直到最后一页
翻页间隔 数字 1 数据分页选择「多页」时生效,单位:秒
数据获取完成后,距离点击下一页按钮时等待的秒数
查找元素超时 数字 10 单位:秒,在查找元素时
如果超过了指定的时间,则认为目标元素不存在
返回值
名称 类型 说明
数据表 数据表 抓取到的相似元素数据

组件示例

  1. 获取结构化数据:点击选择元素,打开百度首页,按照引导获取元素 “新闻” 和 “图片” ,不获取多页数据,返回值数据表数据表
  2. 指定数据表对象数据表数据表,预览窗口显示,结束后关闭预览
  3. 等待等待秒数 10——等待 10 秒后关闭数据表窗口
  4. 运行结果:数据表窗口显示抓取到的数据

注意事项

  • 结构化数据必须获取层级接近或相同的元素,比如在一个页面上同一区域的标题、列表、按钮,但不能通过选择不同区域或层次的元素获取结构化数据。

  • 此组件功能较少,不支持滚屏抓取数据,推荐使用智能抓取组件。

  • 在网页上抓取数据目前支持谷歌、IE、Edge、360 及 Firefox(火狐) 浏览器,除 IE 浏览器外其他浏览器都需要安装插件,具体操作详见浏览器插件安装说明

Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2024-09-02 15:41:48

results matching ""

    No results matching ""