讯飞api
首页
首页
  1. 非实时语音转写
  • 基本介绍
  • 快速开始
    • 开发必读
    • 接口调用
    • 获取token令牌
      POST
  • 音频转写
    • 非实时语音转写
      • 语音转写异步接口对接说明
      • 语音文件异步转写(url音频)
        POST
      • 语音文件异步转写(文件流)
        POST
      • 接收转写结果(调用方实现)
        POST
      • 查询转写结果
        POST
    • 实时语音转写
      • 实时语音转写
  • 语音听写
    • 开启会话
      POST
    • 音频写入
      POST
    • 获取结果
      POST
    • 结束会话
      POST
  • 录音文件识别
    • 调用说明
    • 提交任务
      POST
    • 查询识别结果
      POST
  • ocr识别
    • 获取图像OCR结果
      POST
  • 附录
    • 附录1:错误码枚举
  • 数据模型
    • 令牌信息
    • SubmitRes
    • IatSessionBeginRes
    • Result
    • ResultSubmitRes
    • ResultIatSessionBeginRes
    • OcrReq
    • IstAudioReq
    • SubmitReq
    • IatSessionBeginReq
    • IstReq
    • IatAudioWriteRes
    • key
    • IstAsyncResultVo
    • ResultIatAudioWriteRes
    • ResultIstAsyncResultVo
    • JSONObject
    • IatAudioWriteReq
    • SubResultRes
    • IstResultReq
    • IatGetResultRes
    • SearchResultRes
    • ResultIatGetResultRes
    • ResultSearchResultRes
    • IatGetResultReq
    • SearchResultReq
    • IatSessionEndRes
    • ResultIatSessionEndRes
    • IatSessionEndReq
  1. 非实时语音转写

语音转写异步接口对接说明

语音转写(IST)异步接口对接说明#

1. 服务简介#

语音转写(IST)服务提供音频文件异步转写能力,将音频内容转化为文字。服务采用异步处理模式,提交转写任务后立即返回,转写完成后通过回调或查询获取结果。

2. 音频提交方式#

平台支持两种音频提交方式:
URL方式(/ist/async/process):传入音频文件的公网可访问URL地址,平台自行下载后进行转写。适用于音频已托管在公网可访问存储的场景。
文件上传方式(/ist/async/process/file):直接上传音频文件到平台,平台存储后进行转写。适用于音频在本地、无公网URL的场景。支持mp3/wav格式,文件大小不超过200MB,mp3文件会自动转为wav处理。
两种方式均需传入业务ID(id),用于唯一标识一次转写任务,重复提交相同ID会返回错误。

3. 结果获取方式#

转写完成后,有两种方式获取结果:
回调方式:提交转写时填写 callback 参数(公网可达的HTTP地址),转写完成后平台会主动向该地址POST转写结果。适用于服务端有公网接收地址的场景,实时性更好。
轮询方式:不填 callback 参数,由接入方主动调用查询接口(/ist/async/result)获取结果。适用于无法提供公网回调地址的场景,建议轮询间隔3~5秒。
两种方式可结合使用,如回调失败时可退化为轮询查询。

4. 整体流程#

1.
接入方提交转写任务(URL方式 / 文件上传方式),平台校验通过后异步处理
2.
平台在后台进行音频下载、格式转换、调用转写引擎
3.
转写完成后获取结果:
回调方式:平台主动POST结果到接入方的callback地址
轮询方式:接入方主动调用查询接口,通过status字段判断状态,status >= 2表示转写结束
4.
接入方提交转写任务,平台校验通过后异步处理
5.
平台在后台进行音频下载、格式转换、调用转写引擎
6.
转写完成后:
回调方式:平台主动POST结果到接入方的callback地址
轮询方式:接入方调用查询接口,通过 status 字段判断转写状态,status >= 2 表示转写结束

5. 注意事项#

业务ID(id)需保证唯一,重复提交相同ID会返回错误
音频时长受授权额度限制,剩余时长不足时提交会失败
文件上传方式仅支持mp3/wav格式,mp3会自动转为wav处理
转写为异步处理,提交成功不代表转写成功,需通过回调或查询确认最终结果
修改于 2026-06-29 15:24:14
上一页
获取token令牌
下一页
语音文件异步转写(url音频)
Built with