读取 CSV
组件介绍
读取 CSV 文件内容,保存为数据表。
截图
属性说明
必填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
文件 | 字符串 | 空 | CSV 文件所在路径 |
选填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
编码 | 下拉选项 | 自动 | 读取数据时使用的编码格式: ● 自动: 当前文件已有内容编码 ● 系统默认:系统默认编码,通常是 ANSI ● UTF-8 ● Unicode ● GB2312 |
返回值
名称 | 类型 | 说明 |
---|---|---|
数据表 | 数据表 | CSV 文件内容保存成数据表格式 |
组件示例
- 打开网址:具体设置见截图,网址为
"https://tousu.sina.com.cn/"
- 获取结构化数据:点击选择元素,按照引导,在网页上选取两个标题,返回值数据表
data
- 指定数据表对象:数据表 data,预览窗口显示,结束后关闭预览否
- 等待:6 秒——为了能够更直观的看到数据表预览窗口,否则一闪而过看不到
- 写入 CSV:数据表 data,编码系统默认,保存路径
"./res/news.csv"
——当前流程 res 文件夹下的 news.csv 文件,文件不存在会自动创建 - 读取 CSV:文件 "./res/news.csv",编码系统默认,返回值数据表
csvData
- 指定数据表对象:数据表 csvData,预览窗口显示,结束后关闭预览否
- 等待:6 秒——为了能够更直观的看到数据表预览窗口,否则一闪而过看不到
- 运行结果:打开网页黑猫投诉,并获取标题数据,显示数据表预览窗口,打开 csv 文件发现数据也保存成功了,再读取这个 csv 文件并预览数据表,与之前弹出的预览窗口显示的内容相同
名词解析
变量:顾名思义,是相对于常量(即一成不变的值)存在的,使用变量是为了在使用该变量的过程中,根据不同情景来使用一个时常变化的值。尤其是对于重复使用的值,使用变量还能减轻后期维护成本,比如一个数据在流程中多次使用,不使用变量的话,后期修改就需要一个个的去改,而使用变量则只需要修改变量值,则所有使用该变量的地方都会随之更新。
CSV:一种文档格式,同样的数据在文本文档中可能是 "1,2,3,4,5,6",用 csv 格式打开,分隔符为逗号,就可以用更直观的类似于 Excel 表格的方式进行查看了。
分隔符:将表格转换为文本时,用分隔符标识文字分隔的位置,或在将文本转换为表格时,用其标识新行或新列的起始位置,也可用于word中改变页面的板式。
注意事项
- 结构化数据必须获取层级接近或相同的元素,比如在一个页面上同一区域的标题、列表、按钮,但不能通过选择不同区域或层次的元素获取结构化数据。
- 在网页上抓取数据目前支持谷歌、IE、Edge、360 及 Firefox(火狐) 浏览器,除 IE 浏览器外其他浏览器都需要安装插件,具体操作详见浏览器插件安装说明。
- 文件属性同时支持相对路径和绝对路径,相对路径以点斜杠 ./ 开头,代表该流程路径下文件夹,流程文件夹目录具体介绍详见流程发布文件大小上限。
- 「编码」属性推荐选择自动,会按照文件已有内容的格式进行读取,编码格式错误可能会显示乱码。
- 赋值及返回值创建的变量会显示在右侧栏变量面板中。