音视频转文本
组件介绍
调用阿里大模型提取音视频文件中的文字
SDK 版本
仅支持 v1.0.11.26 及以上版本
截图
属性说明
必填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
文件来源 | 下拉选项 | 本地文件 | 需要转换的文件 ● 本地文件:点击右侧文件夹图标可以选择图片 ● 网络文件:以 http 或者 https 开头的网址 |
音视频文件 | 字符串 列表 |
空 | 「文件来源」选择「本地文件」时生效 支持批量处理,最多同时 100 个音频文件 单个文件大小不超过 2G 支持 pcm、wav、opus、speex、aac、mp4 等多种格式, 推荐 pcm 和 wav |
文件链接 | 字符串 列表 |
空 | 「文件来源」选择「网络文件」时生效, 音视频文件网址 |
选填项
属性名称 | 类型 | 默认值 | 说明 |
---|---|---|---|
保存位置 | 下拉选项 | 资源目录 | 转换后 txt 文件保存位置 资源目录:当前流程的 res 文件夹 自定义:自定义保存路径 |
保存路径 | 字符串 | 空 | 「保存位置」选择「自定义」时生效, 空默认为 res 文件夹 |
文件名 | 下拉选项 | 默认名称 | txt 文件名称 ● 默认名称:以转换时间命名,如 "20241130201245" ● 自定义:自定义文件名称 |
名称 | 字符串 | 空 | 「文件名」选择「自定义」时生效 |
返回值
名称 | 类型 | 说明 |
---|---|---|
文件路径 | 字符串 | 生成 txt 文件路径 |
错误信息 | 字符串 | 转换失败的保存信息 |
组件示例
具体示例详见「开始录音」组件。
注意事项
只需将大模型平台的 API Key 填写到管理平台的人工智能页面 ,无需在编辑器中进行配置,会自动获取对应平台的配置信息,具体操作详见获取阿里云百炼大模型的 API Key。
可以通过判断「错误信息」/「文件路径」是否为空值来判断转换是否成功,转换失败则「错误信息」为非空值,且「文件路径」为空值,判断其中一个条件即可确定转换结果。