科大讯飞人工智能主题大会暨年度发布会在京召开

2023/04/07 10:08:05 热度:

作为国内智能语音与人工智能产业领导者,科大讯飞在北京国家会议中心召开了以“AI复始,万物更新”为主题的科技大会,亦即科大讯飞2015年年度发布会。作为被称为“人工智能之年”的2015年的收官大会,科大讯飞主题大会的内容异彩纷呈,可以说是中国人工智能领域的一场具有标志意义的大会。

大会上,科大讯飞董事长刘庆峰回顾了人工智能诞生整整60年来所经历的两次波峰波谷,对当下的人工智能热潮做出了精彩的评论。在发布环节,刘庆峰发布了建设全新语音交互技术基础上的人工智能时代的人机交互界面——AIUI,以及录音宝、录音笔、讯飞听见网、智学网、E 听说等To C产品,并对“讯飞超脑”2.0版本的近期科研成果进行了精彩介绍和现场演示。科大讯飞高级副总裁、研究院院长胡郁,则在大会上详细讲解了人工智能的科技起源、历史沿革与未来展望,以及科大讯飞产品的技术实现路径。

刘庆峰介绍,1956年的达特茅斯会议是人工智能研究的历史起点,至今正好是一个60年甲子。在这60年的发展过程中,伴随着计算机技术和民用科技突飞猛进的发展,人工智能研究本身经历了两次波峰与波谷,而从2006年起始至今愈发升温的人工智能热,是第三次人工智能浪潮,而60年甲子的当下,正处于人工智能爆发的前夜。在这第三次浪潮中,中国、美国和欧洲,不约而同地将人类大脑研究上升为国家战略科研高度,而以科大讯飞为代表的中国科学家与产业势力,也是历史上第一次与西方的同行们同步前进,共同推动人类科学技术的前沿探索。

刘庆峰表示,人工智能未来会像水和电一样无所不在。而在人工智能的三个层次——计算智能、感知智能和认知智能之中,前两者机器的能力已经超越人类,让机器实现认知智能是目前人工智能科研的焦点,这也是人区别于动物的最本质能力。

而从人类自身的发展来看,产生认知智能的标志是语言的广泛使用。所以,在第三次人工智能浪潮中,世界上众多的科学家都不约而同地从“自然语言理解”这个研究方向上,寻找人工智能的突破口,亦即从语音与语言入手实现机器的认知革命。而科大讯飞也正是从这个方向上取得了令世人瞩目的成就。

刘庆峰介绍,从1998年成功研发出可实用的中文语音交互系统开始,至2014年发布“讯飞超脑”的这17年间,科大讯飞取得了让行业和科技界瞩目的一系列科研成就与产业化成果。科大讯飞的这些成果中,包括获得NIST全球语种识别比赛的冠军,包括获得JWSLT机器翻译评测冠军,包括其产品在国内替代人工进行英语口语测试与普通话级别考试,包括其产品在教育、车载、家居、通信、硬件和国家安全等众多领域的产业化高速推进,并在这个过程中从一家大学生创业公司,成长成为目前市值超过500亿的中国高科技公司。

在产品发布环节,刘庆峰首先定义了认知智能的三大核心支撑能力:人机交互、知识管理与推理学习。而随后科大讯飞发布的讯飞超脑2.0科研项目,正是围绕这三方面持续展开,不但赋予机器“能听会说”的能力,还能赋予机器“能理解会思考”的能力,使机器可以在不久的将来在高考中折桂。

而在讯飞超脑的产业化应用产品层面,刘庆峰发布了对科大讯飞具有里程碑意义的人机交互新产品——AIUI。刘庆峰认为,在实际上已经到来的“万物互联”时代,客观上对人机交互提出了更高的要求。但是,一方面目前大多数设备没有屏幕并且与用户之间有一定的距离,另一方面随时随地的多方交互的需求越发明显。于是,科大讯飞又在此次大会上定义了“万物互联”时代的人机语音交互标准,其基本能力应该包括三方面:远场识别、全双工、多轮交互。

AIUI集成了包括双全工技术、麦克风阵列技术、声纹识别技术、方言识别、语义理解技术和和内容服务等等——科大讯飞一些列尖端科研成果和完善服务,代表业界最高水准的技术产品。在发布现场,科大讯飞在全球首次将演讲人(刘庆峰)的演讲同步转写成文字在大屏幕显示,敢于接受现场数千参会者和数千万观看视频直播观众的检验。

在作出两个定义和相关发布之后,刘庆峰表示,在讯飞超脑的应用层上,教育产业也是科大讯飞将自身科研成果产业化最成功的领域之一。目前,全国已经有31个省市的8000万师生在使用科大讯飞面向K12教育所推出的高科技教学与考评产品,有效解决了之前“老师忙、学生盲、资源茫”的教育行业困境,不仅实现了语音与文字的识别、合成与分类,并且实现了智能批改、全科阅卷、资源库自动建设等真正具备“人工智能”的产品目标,为中国的整个教育体系实现梦寐以求的个性化教学提供了有力支撑。刘庆峰认为,正是在此基础上,作为科大讯飞的To C教育产品——智学网与E听说具备非常可观的市场价值。

除上述产品之外,科大讯飞还在大会上发布了实用性很强的To C产品——录音宝、录音笔与讯飞听见网。据刘庆峰介绍,实际上,音文转写是当下都市生活的一种经常性需求,在正式发布之前,录音宝产品已经有了超过100万的用户就是这种需求的证明。而随着流媒体的不断演进与普及,相信,在未来的图文直播时代,科大讯飞的音文转录产品的价值将会更加凸显。

刘庆峰表示,录音宝、录音笔与讯飞听见网这三款新锐产品,将与讯飞输入法(2.8亿用户)、灵犀语音助手(1.2亿用户)、叮咚智能音箱(2015年市场份额最大的WiFi音箱)、智学网、E听说一道,构成科大讯飞的To C产品线第一阵营,而科大讯飞还将继续在To C业务的条线上,推出受市场欢迎的高科技产品。

在大会最后,刘庆峰表示,在实际上已经到来的“万物互联时代”,语音为主,触摸、图像、手势为辅,将成为人机交互的新常态,而在这种人类生活的新常态中,人工智能技术的突破是用来延伸人类能力而非替代人类的。人工智能将使人类更幸福、更富想象力和创造力。

而相比之前的人工智能浪潮中的明星公司,科大讯飞将依靠自身强大的人工智能科研实力与优质产品,更具创造性地去改变世界,让人们的生活更加美好。