音视频转文本

组件介绍

调用阿里大模型提取音视频文件中的文字

SDK 版本

仅支持 v1.0.11.26 及以上版本

截图

属性说明

必填项

属性名称	类型	默认值	说明
文件来源	下拉选项	本地文件	需要转换的文件 ● 本地文件：点击右侧文件夹图标可以选择图片 ● 网络文件：以 http 或者 https 开头的网址
音视频文件	字符串列表	空	「文件来源」选择「本地文件」时生效支持批量处理，最多同时 100 个音频文件单个文件大小不超过 2G 支持 pcm、wav、opus、speex、aac、mp4 等多种格式，推荐 pcm 和 wav
文件链接	字符串列表	空	「文件来源」选择「网络文件」时生效，音视频文件网址

选填项

属性名称	类型	默认值	说明
保存位置	下拉选项	资源目录	转换后 txt 文件保存位置资源目录：当前流程的 res 文件夹自定义：自定义保存路径
保存路径	字符串	空	「保存位置」选择「自定义」时生效，空默认为 res 文件夹
文件名	下拉选项	默认名称	txt 文件名称 ● 默认名称：以转换时间命名，如 "20241130201245" ● 自定义：自定义文件名称
名称	字符串	空	「文件名」选择「自定义」时生效

返回值

名称	类型	说明
文件路径	字符串	生成 txt 文件路径
错误信息	字符串	转换失败的保存信息

组件示例

具体示例详见「开始录音」组件。

注意事项

只需将大模型平台的 API Key 填写到管理平台的人工智能页面，无需在编辑器中进行配置，会自动获取对应平台的配置信息，具体操作详见获取阿里云百炼大模型的 API Key。
可以通过判断「错误信息」/「文件路径」是否为空值来判断转换是否成功，转换失败则「错误信息」为非空值，且「文件路径」为空值，判断其中一个条件即可确定转换结果。

results matching ""

No results matching ""