发布时间:2021-10-26 10:46 作者:未知
今天给大家分享的是百度NLP携手小度斩获全球顶级科技竞赛DSTC10冠军的相关信息,下面我们一起来看具体详情!
近期,由小度与自然语言处理部门(NLP)组成的百度代表队,参加了全球人工智能领域顶级竞赛DSTC10,最终斩获了知识型任务口语对话赛道(Track2)两项任务的全部冠军。在“任务式对话状态追踪”任务中,以JGA(全部信息都预测正确的对话比例)46%、领先第二名10个百分点的成绩强势问鼎!在“知识对话”任务中,同样拔得头筹!中国自主对话AI技术再一次惊艳世界。
对话状态追踪任务榜单
知识对话任务榜单
百度团队代码A11、B10,图片来源于DSTC10官网
参加比赛的同学非常不容易,因为,这个赛道是有史以来同类型任务中最难的!图片
任务难点
口语场景下模型输入包含大量语音识别错误,例如,是“Korean food(韩国料理)”,还是“currying food(咖喱食品)”?非常考验AI算法的推理泛化性能;
仅提供少量对话作为测试数据,不提供训练数据,非常考验参赛团队的技术积累。
大赛要求
方案能够解决多轮连续对话中的复杂语义理解问题,还要能够对语音交互和识别中的错误进行自动纠错和理解,同时需要将用户需求中的每一个部分都理解对才算通过。
小度&NLP团队迎难而上,凭借以下方案亮点,在竞赛中脱颖而出。
1,基于百度PLATO大规模对话预训练模型,进行端到端建模;
2,创新性提出了多层级数据增强框架,解决数据匮乏难题;
3,匹配方法和生成方法结合,多视角提升效果稳定性;
4,层次化建模,多维度捕捉细节和全局语义信息;
5,创造性地在任务型对话中使用知识增强的方法强化语义表示,抵抗语音识别错误。
太深奥了!
————给大家举几个例子————
场景一:
-“小度小度,我想听大梦一场空。”
-“好的,一首徐海俏的《空》送给你。”
当你还在搜索“大梦一场空是什么歌”的时候,小度已经为你播放了出来;
场景二:
-“小度小度,周杰伦那个歌气球。”
-“好的呀,一首周杰伦的《告白气球》送给你。”
家中收音环境有时嘈杂,即使语音输入有一定误差,小度依然能准确理解语义;
场景三:
-“小度小度,小老鼠。”
-“小度为您继续播放《猫和老鼠》。”
-“小度小度,三国。”
-“小度为您继续播放《火烧赤壁》。”
常常看《猫和老鼠》动画片的小朋友,说“小老鼠”的时候,小度就能开始续播《猫和老鼠》;常常听《三国演义》评书的老爷爷,说完“三国”,小度就能准确定位到评书接之前听的《火烧赤壁》。小度的个性化知识增强了多轮理解能力,用户用得越久,小度越容易理解你的需求。
这些陪伴用户日常生活中的寻常技能,背后其实是问鼎世界的AI对话技术。
一个复杂的对话需求,经过前沿的技术处理,为用户带来了“开口即得”的人机交互体验。我们将不断加码科技自主创新,“用科技让复杂的世界更简单”️。
更多百度NLP与小度人机交互相关内容,百度云服务中心持续分享中!