实时语音翻译
更新时间:2025-08-04
接口描述
实时语音翻译api采用websocket协议的连接方式,能够将音频流实时识别为文字,支持智能断句,实时输出带有标点的语音识别结果和翻译结果,支持45个语种的识别和相互翻译。
接口限制
- 目前支持45个语言的互译,见语言列表
-
音频参数要求:目前只支持pcm格式的原始音频数据
- 采样率:8kHz、16kHz、44.1kHz
- 位深:16bits
- 单声道
- 小端序
接入方式
- 接口协议:
WebSocket
- 请求URL:
wss://aip.baidubce.com/ws/realtime_speech_trans
主要流程
实时语音翻译API基于WebSocket协议进行全双工的流式消息发送和接受。实现逻辑如下:
- 建立WebSocket连接,并发送开始报文
- 发送实时音频流报文
- 接收实时翻译结果报文、TTS播报报文
- 发送结束报文并关闭WebSocket连接
报文格式
方向 | 报文类型 | WebSocket opcode | WebSocket消息体序列化协议 |
---|---|---|---|
客户端请求报文 | 开始报文 | text | json |
实时音频报文 | binary | 无。音频原始二进制数据 | |
结束报文 | text | json | |
服务端响应报文
|
确认开始报文 | text | json |
实时翻译结果报文 | text | json | |
TTS播报报文 | binary | 实时语音翻译二进制响应报文序列化协议(见下) | |
确认结束报文 | text | json |
大排畸是什么检查0297y7.com | 父亲节出什么生肖hcv8jop6ns7r.cn | 马非读什么hcv9jop1ns6r.cn | 牙疼有什么好办法hcv7jop5ns5r.cn | 中国的八大菜系是什么hcv7jop9ns2r.cn |
白带有血丝是什么原因hcv9jop2ns3r.cn | 什么人不能摆放大象hcv9jop8ns1r.cn | 男生为什么会勃起hcv8jop8ns7r.cn | 颈部淋巴结肿大挂什么科bfb118.com | 做梦梦见水是什么意思hcv8jop9ns3r.cn |
包皮溃烂是什么原因hcv9jop0ns0r.cn | 此什么非彼什么的意思hcv8jop2ns8r.cn | 什么血型最招蚊子hcv8jop6ns0r.cn | clara是什么意思hcv9jop3ns5r.cn | 医生为什么会建议竖切adwl56.com |
武松是什么生肖hcv8jop1ns1r.cn | alt是什么hcv9jop3ns6r.cn | 什么运动瘦肚子最快hcv8jop3ns4r.cn | 秋字五行属什么hcv9jop7ns4r.cn | 男人为什么会遗精hcv9jop6ns8r.cn |