结构化数据(仅支持 Windows)

组件介绍

在网页或者桌面程序中批量抓取相似元素的数据,包括列表、表格等,同时支持抓取多页数据。

截图

属性说明

必填项
属性名称 类型 默认值 说明
目标元素 元素 使用元素探测抓取到的信息,可能是表格,也可能是列表
通用选填项
属性名称 类型 默认值 说明
获取条数 数字 0 必须是整数,0 代表获取当前页所有符合条件的元素数据,
如果目标是列表元素,会自动填写符合条件的元素数据数量
数据分页 下拉选项 单页 ● 单页:只抓取当前页面的数据
● 多页:点击下一页进行翻页,抓取多页数据
查找元素超时 数字 10 单位:秒,在查找元素时
如果超过了指定的时间,则认为目标元素不存在
单页选填项

多页选填项
属性名称 类型 默认值 说明
下一页 元素 需要选择下一页元素
点击方式 下拉选项 模拟鼠标 选择下一页元素时生效,
点击下一页元素的方式
● 自动化接口:使用系统自带的自动化点击接口,在某些位置可能不生效
● 模拟鼠标:模拟鼠标进行点击,
当自动化接口不生效时可以尝试此方式,会移动鼠标位置
● 系统消息:使用系统发送消息到窗口的方式,多用于网页
获取页数 数字 0 选择下一页元素时生效,
需要获取数据的页数
0 默认为一直点击下一页元素直到最后一页
翻页间隔 数字 1 选择下一页元素时生效,单位:秒
点击下一页后等待数据加载的时间,空默认为 1
返回值
名称 类型 说明
数据表 数据表 抓取到的相似元素数据

组件示例

  1. 获取结构化数据:点击选择元素,打开百度首页,按照引导获取元素 “新闻” 和 “图片” ,不获取多页数据,返回值数据表数据表
  2. 指定数据表对象数据表数据表,预览窗口显示,结束后关闭预览
  3. 运行结果:数据表窗口显示抓取到的数据

注意事项

  • 点击「选择元素」后鼠标悬停需要选择的元素,在高亮选中元素后按下 CTRL+鼠标右侧选择元素。
  • 元素所在区域为列表时只需要选择一个元素,非列表时需要选择两个元素。
  • 结构化数据必须获取层级接近或相同的元素,比如在一个页面上同一区域的标题、列表、按钮,但不能通过选择不同区域或层次的元素获取结构化数据。
  • 此组件功能较少,不支持滚屏抓取数据,推荐使用智能抓取组件。
  • 在网页上抓取数据目前支持谷歌、IE、Edge、360 及 Firefox(火狐) 浏览器,除 IE 浏览器外其他浏览器都需要安装插件,具体操作详见浏览器插件安装说明
Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2025-03-04 17:58:30

results matching ""

    No results matching ""