提取 PDF 文字

组件介绍

提取 PDF 文件中的文本内容

截图

属性说明

必填项
属性名称 类型 默认值 说明
文件 字符串 PDF 文件路径,可以点击右侧的文件夹图标进行选择
选填项
属性名称 类型 默认值 说明
密码 字符串 如果文件设置了密码需要输入正确的密码
范围 下拉选项 所有页 需要进行转换的页码范围:
● 所有页
● 部分页:连续多页
● 单页:指定某一页
起始页码 数字 范围选择「部分页」时开始转换的页码,
为空、负数或者 0 默认为 1
结束页码 数字 范围选择「部分页」时停止转换的页码,
超过 PDF 实际页码默认为页码最大页
页码 数字 范围选择「单页」时的页码
返回值
名称 类型 说明
文字 字符串 提取的文本内容,只有图片时返回空字符串

组件示例

  1. 提取 PDF 文字文件选择 pdf 文件,其他选项默认,返回值文本 text
  2. if else 假如...否则 text规则条件空值 —— 判断文本内容是否为空字符串
  3. 输出日志日志 "内容为空字符串"
  4. 输出日志日志 text
  5. 运行结果:日志面板输出提取到的文本内容

注意事项

  • 文件同时支持相对路径和绝对路径,相对路径以点斜杠 ./ 开头,代表该流程路径下文件夹,流程文件夹目录具体介绍详见流程发布文件大小上限。

  • 范围属性选择部分页时,结束页码必须大于或者等于起始页码,否则会报错。

Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2024-09-02 15:41:48

results matching ""

    No results matching ""