百度发布国内首款AI输入法,进入全感官输入2.0时代

1月16日,百度输入法“AI•新输入 全感官输入2.0”发布会在京举行,发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相。据悉,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。

语音作为人机交互的全新入口,已经在过去几年席卷全世界。语音技术的进步,不仅体现在各式各样的智能设备里,还在不断赋能移动设备输入法的变革,依托语音便捷的交互方式,输入法里语音输入也在悄然改变着用户与设备交互的模式。

可以设想一下,当输入告别键盘,而语音、表情、动作却成为输入方式,会是一种怎样的神奇体验?

1月16日,百度输入法“AI•新输入 全感官输入2.0”发布会在京举行,发布会上,国内首款真正意义上的AI输入法——百度输入法AI探索版正式亮相。据悉,这是一款默认输入方式为全语音输入,并调动表情、肢体等进行全感官输入的全新输入产品。

同时,百度宣布语音技术取得一项对全球学术界和工业界都具备重大意义的技术突破,流式截断的多层注意力建模(SMLTA)将在线语音识别精度提升了15%,并在世界范围内首次实现了基于Attention技术的在线语音识别服务大规模上线应用。

现场,百度语音技术部负责人高亮宣布了百度语音输入的四项重大突破和给输入法用户带来的体验提升——在线语音、离线语音、中英自由说和方言自由说。

在线语音领域,百度发布流式截断多层注意力建模(SMLTA),这是中文在线语音识别历史上的两个重大突破:世界上首次实现了局部注意力建模识别精度超过全局注意力模型;世界上第一次大规模部署在线语音交互注意力模型。这一技术能够解决传统Attention模型在识别中的时延性,以及因此导致的无法进行大规模在线语音实时交互的问题,并将在线语音识别精度提升了15%,超越行业最高水平15%。

离线语音识别领域,为解决用户多元输入场景的需求,百度持续优化Deep Peak 2系统,让离线语音输入相对准确率再次提升,高于行业平均水平35%。即使用户处于地铁、电梯、隧道或人流密集等离线场景中,依然可以借助百度输入法进行精准的语音输入。

中英文混合语音输入技术,以及方言与方言、方言与普通话的混合语音输入技术突破,让用户真正实现“自由说”,无论是中英文夹杂,还是普通话家乡话来回切换,百度输入法都能准确识别。据介绍,百度输入法是目前唯一实现了高精度“中英自由说”和“方言自由说”的输入法产品。

此外,伴随着百度语音、视觉、自然语言处理、知识图谱等百度AI技术落地输入法,“全感官”的输入变成现实。除了语音输入,百度输入法AI探索版还推出了拍立活、秀场、凌空手写等新功能玩法。无论是心爱的偶像,还是日夜陪伴的宠物,“拍立活”功能都可以让用户通过自己的动作“驱动”对方做出相同表情;“秀场”功能运用图像分割技术,让用户“穿越”到不同的虚拟场景之中,科技、清新、赛博朋克多种风格随意挑选,表情创作更具场景感、更加生活化;凌空手写如同隔空打怪,在空中书写也能被流畅识别,目前整体识别率已达到大规模应用的要求。

智能语音作为AI落地的最佳场景之一,必然会应用到越来越多的领域。凝趣作为全球智能语音方案商,必然会研发出更多的智能语音应用场景,为中小型企业提供多元化的转型之路。而输入法本质上是一款人机交互的工具,AI时代正在到来,人机交互的形态也将随之革新。也相信百度输入法不仅基于手机端,还能够连通包括智能家居、车联网等多种终端场景,集多种输入方式为一体,帮助用户在各种场景下高效、自如地传递信息。

免责声明:该自媒体文章由实名作者自行发布(文字、图片、视频等版权内容由作者自行担责),且仅为作者个人观点,不代表 秒送号Miaosong.cn立场,未经作者书面授权,禁止转载。[投诉 · 举报作者与内容]

「作者 · 档案」
这个人很懒,什么都没有留下~

  
(0)

发表回复

登录后才能评论
发布