音视频转文本

组件介绍

调用阿里大模型提取音视频文件中的文字

SDK 版本

仅支持 v1.0.11.26 及以上版本

截图

属性说明

必填项
属性名称 类型 默认值 说明
文件来源 下拉选项 本地文件 需要转换的文件
● 本地文件:点击右侧文件夹图标可以选择图片
● 网络文件:以 http 或者 https 开头的网址
音视频文件 字符串
列表
「文件来源」选择「本地文件」时生效
支持批量处理,最多同时 100 个音频文件
单个文件大小不超过 2G
支持 pcm、wav、opus、speex、aac、mp4 等多种格式,
推荐 pcm 和 wav
文件链接 字符串
列表
「文件来源」选择「网络文件」时生效,
音视频文件网址
选填项
属性名称 类型 默认值 说明
保存位置 下拉选项 资源目录 转换后 txt 文件保存位置
资源目录:当前流程的 res 文件夹
自定义:自定义保存路径
保存路径 字符串 「保存位置」选择「自定义」时生效,
空默认为 res 文件夹
文件名 下拉选项 默认名称 txt 文件名称
● 默认名称:以转换时间命名,如 "20241130201245"
● 自定义:自定义文件名称
名称 字符串 「文件名」选择「自定义」时生效
返回值
名称 类型 说明
文件路径 字符串 生成 txt 文件路径
错误信息 字符串 转换失败的保存信息

组件示例

具体示例详见「开始录音」组件。

注意事项

  • 只需将大模型平台的 API Key 填写到管理平台的人工智能页面 ,无需在编辑器中进行配置,会自动获取对应平台的配置信息,具体操作详见获取阿里云百炼大模型的 API Key

  • 可以通过判断「错误信息」/「文件路径」是否为空值来判断转换是否成功,转换失败则「错误信息」为非空值,且「文件路径」为空值,判断其中一个条件即可确定转换结果。

Copyright 北京库木塔格科技有限公司 2024 all right reserved,powered by Gitbook该文章修订时间: 2025-03-17 15:42:51

results matching ""

    No results matching ""