智能抓取

结构化数据,通俗来讲就是网页和桌面程序中,界面中具有层级关系的节点的信息。

网页中的结构化数据,可以按照 HTML 标签构成分为表格和非表格。

表格

对于表格元素,探测获取其中任意一个单元格,就可以抓取整个表格。

  1. 在网页中选择单元格元素,按下 CTRL+鼠标左键进行抓取表格元素
  2. 预览表格数据,在预览数据窗口点击当前列名右侧的编辑按钮可以删除此列及提取链接

非表格

对于非表格元素,需要探测获取两个元素来确定元素对象。

  1. 在网页中按照提示选择元素,按下 CTRL+鼠标左键进行抓取两个同级元素
  2. 预览数据,在预览数据窗口点击当前列名右侧的编辑按钮可以删除此列及提取链接

抓取多页数据

当需要抓取不止一页的数据时,可以在右侧属性【数据分类】选择多页并在【下一页】抓取下一页元素。

关于下一页元素的注意事项,详见元素探测-属性编辑

Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2024-05-16 13:00:48

results matching ""

    No results matching ""