发布时间:2022-03-01 17:10 作者:创始人
简述:百度AI语音实时显示采用websocket协议的连接方式,上传音频的同时文字识别结果同步显示,目前有Java、Android、Python、C++的编程语音。适用于直播质检、会议记录、音视频字幕、长句语言输入等场景,能够识别普通话、英文。
百度AI语音实时显示采用websocket协议的连接方式,上传音频的同时文字识别结果同步显示,目前有Java、Android、Python、C++的编程语音。适用于直播质检、会议记录、音视频字幕、长句语言输入等场景,能够识别普通话、英文。
百度AI语音实时显示的两种格式:
1、实时音频流输入:上传必须要是实时的,不宜过快。总的来说总体耗时会多于原始音频流的时长。
2、音频文件输入:支持pcm格式的音频文件,每160ms为一帧发送,间隔1-2ms,整体耗时短于音频流输入,单次调用接口的音频时长目前不超过1小时。
百度AI语音实时显示要求环境的安静程度,且语速正常不能多个人同时发音,所以在嘈杂的环境、有背景音乐或者是合成的音频、远场景语音这些场景的情况下,识别效果准确率会下降甚至有识别不出来的情况。百度AI语音实时显示还针对某些专业领域名词识别不准的情况,客户可使用模型训练(上传文本或词汇后即可训练)。
产品可预付费和后付费两种模式:
1、预付费:比较适用于时长可预估的企业,具有10小时的免费时长。1000小时1800元、10000小时15000元、100000小时120000元。
2、后付费:适用于时长无法预估的企业,具有10小时免费时长。继续使用收费为3元/小时。
百度AI语音实时显示可以助您精准快速识别,快速上手,简单易用!
热搜词
微信公众号
手机站
COPYRIGHT 2007-2020 TUIDC ALL RIGHTS RESERVED 腾佑科技-百度AI人工智能_百度人脸识别_图像识别_语音识别提供商
地址:河南省郑州市姚砦路133号金成时代广场6号楼13层 I CP备案号:豫B2-20110005-1 公安备案号: 41010502003271
声明:本站发布的内容版权归郑州腾佑科技有限公司所有,本站部分素材来源于网络及网友投稿,若无意中侵犯了您的版权,请致电在线客服我们将在核实后予以删除!