发布时间:2024-07-13 17:44 作者:创始人
简述:百度语音识别类别下面有个实时语音识别算法,就是针对实时语音流的,能够将音频流实时识别为文字,适用于长句语音输入、音视频字幕、会议等场景。
百度语音识别支持实时流上传吗?是支持的。百度语音识别类别下面有个实时语音识别算法,就是针对实时语音流的,能够将音频流实时识别为文字,适用于长句语音输入、音视频字幕、会议等场景。
实时语音识别api支持的两种输入格式:
1、实时音频流输入:上传必须是实时,不能过快。即整体耗时略多于原始音频流长度。如果因为导致网络不稳定需要发起新请求续传,接口允许超发XXms的录音音频;即此时不必“实时“,可以一下子将需要追溯的音频全部发给服务端。单次调用接口的音频时长目前不超过1小时。
2、音频文件输入:支持pcm格式的音频文件,每160ms为一帧发送,间隔1-2ms,整体耗时短于音频流输入,单次调用接口的音频时长目前不超过1小时。
l 调用不限编程语言,只要能发送websocket请求即可,推荐在服务器上调用。
百度实时语音识别api支持Android、iOS、Linux SDK,可以在多种操作系统、多种设备终端上调用,快速上手,简单易用;此外支持普通话和略带口音的中文识别;支持英文识别。如果您想体验即刻联系在线客服领取测试额度吧!
热搜词
微信公众号
手机站
COPYRIGHT 2007-2020 TUIDC ALL RIGHTS RESERVED 腾佑科技-百度AI人工智能_百度人脸识别_图像识别_语音识别提供商
地址:河南省郑州市姚砦路133号金成时代广场6号楼13层 I CP备案号:豫B2-20110005-1 公安备案号: 41010502003271
声明:本站发布的内容版权归郑州腾佑科技有限公司所有,本站部分素材来源于网络及网友投稿,若无意中侵犯了您的版权,请致电在线客服我们将在核实后予以删除!