讯飞api
首页
首页
  1. 录音文件识别
  • 基本介绍
  • 快速开始
    • 开发必读
    • 接口调用
    • 获取token令牌
      POST
  • 音频转写
    • 实时语音转写
    • 语音文件异步转写
      POST
    • 异步接收转写结果
      POST
  • 语音听写
    • 开启会话
      POST
    • 音频写入
      POST
    • 获取结果
      POST
    • 结束会话
      POST
  • 录音文件识别
    • 调用说明
    • 提交任务
      POST
    • 查询识别结果
      POST
  • ocr识别
    • 获取图像OCR结果
      POST
  • 附录
    • 附录1:错误码枚举
  1. 录音文件识别

调用说明

本文介绍录音文件识别API的使用。
语音识别提供的文件转写API,能够对常见的音频或音视频文件进行语音识别,并将结果返回给调用者。API提供丰富的输出选项,包括全文级文字、句子级文字、词和时间戳等。
由于音视频文件的尺寸通常较大,文件传输和语音识别处理均需要时间,文件转写API通过异步调用方式来提交任务。开发者需要通过查询接口,在文件转写完成后获得语音识别结果。文件转写API支持批处理,用户可以单次上传最多100个文件URL,待所有URL转写完成后,用户可以一次性获取全部转写结果。
录音文件识别目前不支持识别本地文件。
音频格式支持范围
aac、amr、avi、flac、flv、m4a、mkv、mov、mp3、mp4、mpeg、ogg、opus、wav、webm、wma、wmv
前提条件
联系管理员开通授权
注意事项
在一个任务中对多个音频文件进行识别(即包含多个子任务)时,只要有一个子任务成功,整个任务的状态就会标记为SUCCEEDED。请通过查看每个子任务的sub_task_status和message来判断具体的任务状态。
修改于 2025-02-21 10:37:23
上一页
结束会话
下一页
提交任务
Built with