读取 CSV
组件介绍
读取 CSV 文件内容,保存为数据表。
截图
属性说明
必填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
文件 | 字符串 | 空 | CSV 文件所在路径 |
选填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
编码 | 下拉选项 | 自动 | 读取数据时使用的编码格式: ● 自动: 当前文件已有内容编码 ● 系统默认:系统默认编码,通常是 ANSI ● UTF-8 ● Unicode ● GB2312 |
返回值
名称 | 类型 | 说明 |
---|---|---|
数据表 | 数据表 | CSV 文件内容保存成数据表格式 |
组件示例
- 打开网址:具体设置见截图,网址为
"https://tousu.sina.com.cn/"
- 获取结构化数据:点击选择元素,按照引导,在网页上选取两个标题,返回值数据表
data
- 指定数据表对象:数据表 data,预览窗口显示,结束后关闭预览否
- 写入 CSV:数据表 data,编码系统默认,保存路径
"./res/news.csv"
——当前流程 res 文件夹下的 news.csv 文件,文件不存在会自动创建 - 读取 CSV:文件 "./res/news.csv",编码系统默认,返回值数据表
csvData
- 指定数据表对象:数据表 csvData,预览窗口显示,结束后关闭预览否
- 运行结果:打开网页黑猫投诉,并获取标题数据,显示数据表预览窗口,打开 csv 文件发现数据也保存成功了,再读取这个 csv 文件并预览数据表,与之前弹出的预览窗口显示的内容相同
名词解析
CSV:一种文档格式,同样的数据在文本文档中可能是 "1,2,3,4,5,6",用 csv 格式打开,分隔符为逗号,就可以用更直观的类似于 Excel 表格的方式进行查看了。
分隔符:将表格转换为文本时,用分隔符标识文字分隔的位置,或在将文本转换为表格时,用其标识新行或新列的起始位置,也可用于word中改变页面的板式。
注意事项
- 结构化数据必须获取层级接近或相同的元素,比如在一个页面上同一区域的标题、列表、按钮,但不能通过选择不同区域或层次的元素获取结构化数据。
- 在 Windows 系统网页上选择元素目前支持谷歌、IE、Edge、360 及 Firefox(火狐) 浏览器(Linux 系统仅支持谷歌及火狐浏览器),除 IE 浏览器外其他浏览器都需要安装插件,具体操作详见浏览器插件安装说明。
- 文件属性同时支持相对路径和绝对路径,相对路径以点斜杠 ./ 开头,代表该流程路径下文件夹,流程文件夹目录具体介绍详见流程发布文件大小上限。
- 「编码」属性推荐选择自动,会按照文件已有内容的格式进行读取,编码格式错误可能会显示乱码。