读取 CSV

组件介绍

读取 CSV 文件内容,保存为数据表。

截图

属性说明

必填项
属性名称 类型 默认值 说明
文件 字符串 CSV 文件所在路径
选填项
属性名称 类型 默认值 说明
编码 下拉选项 自动 读取数据时使用的编码格式:
● 自动: 当前文件已有内容编码
● 系统默认:系统默认编码,通常是 ANSI
● UTF-8
● Unicode
● GB2312
返回值
名称 类型 说明
数据表 数据表 CSV 文件内容保存成数据表格式

组件示例

  1. 打开网址:具体设置见截图,网址为"https://tousu.sina.com.cn/"
  2. 获取结构化数据:点击选择元素,按照引导,在网页上选取两个标题,返回值数据表data
  3. 指定数据表对象数据表 data,预览窗口显示,结束后关闭预览
  4. 等待:6 秒——为了能够更直观的看到数据表预览窗口,否则一闪而过看不到
  5. 写入 CSV数据表 data,编码系统默认,保存路径"./res/news.csv"——当前流程 res 文件夹下的 news.csv 文件,文件不存在会自动创建
  6. 读取 CSV文件 "./res/news.csv",编码系统默认,返回值数据表csvData
  7. 指定数据表对象数据表 csvData,预览窗口显示,结束后关闭预览
  8. 等待:6 秒——为了能够更直观的看到数据表预览窗口,否则一闪而过看不到
  9. 运行结果:打开网页黑猫投诉,并获取标题数据,显示数据表预览窗口,打开 csv 文件发现数据也保存成功了,再读取这个 csv 文件并预览数据表,与之前弹出的预览窗口显示的内容相同

名词解析

  • 变量:顾名思义,是相对于常量(即一成不变的值)存在的,使用变量是为了在使用该变量的过程中,根据不同情景来使用一个时常变化的值。尤其是对于重复使用的值,使用变量还能减轻后期维护成本,比如一个数据在流程中多次使用,不使用变量的话,后期修改就需要一个个的去改,而使用变量则只需要修改变量值,则所有使用该变量的地方都会随之更新。

  • CSV:一种文档格式,同样的数据在文本文档中可能是 "1,2,3,4,5,6",用 csv 格式打开,分隔符为逗号,就可以用更直观的类似于 Excel 表格的方式进行查看了。

  • 分隔符:将表格转换为文本时,用分隔符标识文字分隔的位置,或在将文本转换为表格时,用其标识新行或新列的起始位置,也可用于word中改变页面的板式。

注意事项

  • 结构化数据必须获取层级接近或相同的元素,比如在一个页面上同一区域的标题、列表、按钮,但不能通过选择不同区域或层次的元素获取结构化数据。
  • 在网页上抓取数据目前支持谷歌、IE、Edge、360 及 Firefox(火狐) 浏览器,除 IE 浏览器外其他浏览器都需要安装插件,具体操作详见浏览器插件安装说明
  • 文件属性同时支持相对路径和绝对路径,相对路径以点斜杠 ./ 开头,代表该流程路径下文件夹,流程文件夹目录具体介绍详见流程发布文件大小上限
  • 「编码」属性推荐选择自动,会按照文件已有内容的格式进行读取,编码格式错误可能会显示乱码。
  • 赋值及返回值创建的变量会显示在右侧栏变量面板中。
Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2024-09-02 15:41:48

results matching ""

    No results matching ""