(记者杨洁) 两会几乎成为科大讯飞的“产品秀场”,记者们几乎人手一个讯飞听见录音笔用来整理采访录音,央视用科大讯飞的AI语音合成技术给主播白岩松训练了一个AI助理“小白”。全国人大代表、科大讯飞董事长刘庆峰表示,现在写建议都是用自家的语音识别系统,去各地调研开会也带着自家的录音笔,代表履职效率比原来提高了很多。
刘庆峰接受记者采访时表示,2019年是人工智能价值兑现之年,人工智能产业化规模应用落地的机会比以前更大,公司将抓住这一机遇,科大讯飞人工智能战略2.0不仅要实施更多技术创新探索,还要同步交出具有经济效益的完美答卷。
图片来源:图虫创意
占领技术高点
“一年拿12个世界冠军,平均一个月拿一个!”刘庆峰自豪地对记者说,2018年,科大讯飞拿了12个语音领域权威比赛的世界冠军,在国际最权威的语音识别、合成和自然语言理解比赛中继续保持了全球领先技术优势,并且进一步拓展到图像识别等领域。
刘庆峰说,创业二十年,人工智能浪潮有过起落,科大讯飞几经质疑、挫折,走着波浪式、锯齿式发展的前进道路,他“还没觉得累”,一个非常重要的原因就是发自内心的信仰和热爱,“未来20年,人工智能一定会深刻改变这个世界。”他说。
刘庆峰表示,现在已体现出两大非常重要的产业趋势。一是万物互联时代到来。万物互联是继互联网之后最大的产业浪潮。这是一个以语音为主、键盘触摸为辅的全新人机交互时代,对语音交互提出了迫切需求和技术期待,涉及方言、噪音、口音和远场等方面,因此语音识别的技术门槛不会降低,而是会进一步抬高。二是认知智能会得到规模应用。“近景环境下,你对着话筒,用清晰的声音,可以非常准确地进行语音识别。如果在远场环境,站在5米到8米之外,用语音控制,语音识别准确率就会急速下降。在有噪音、有口音的情况下,语音识别准确率也会急速下降。”刘庆峰表示,万物互联时代,语音识别技术还有非常大的提升空间,这是科大讯飞正在占领的一个技术制高点。
2018年,国际语音识别最权威的比赛CHiME-5考察了多个噪声和远场环境下的语音识别效果,科大讯飞包揽了全部四个项目的第一。更重要的是,比赛主办方用最新的算法和深度学习模型所做的参考系统语音识别错误率达81.14%,可以说是“史上最难语音识别任务”,但讯飞团队提交的系统将错误率降低了35个百分点,以显著优势获得第一。
推进AI应用
刘庆峰当了四届全国人大代表,几乎每年都会提与人工智能有关的建议或议案。2019年两会也不例外,刘庆峰建议,人工智能要加强行业落地,推动人工智能开放平台、行业大数据中心、典型应用场景的深度融合,以人工智能开放平台作为技术与应用的交汇所,为生态中所有参与者赋能;大数据反哺人工智能技术产品的研究开发;各级大数据管理局应加强数据的适度管理尺度,加之典型应用场景的快速突破,形成数据和应用场景的良性互动,在医疗、教育等行业实现跨越式发展。
刘庆峰说,“很多人问我为什么每年都提AI的建议或议案,我说,’我十年前这样提,再过十年还会提。’因为这是一个伟大的历史进程,很多AI技术需持续突破。”
刘庆峰表示,2019年是人工智能规模化应用落地之年。“科大讯飞要让人工智能从典型应用示范转向规模化推广,科大讯飞会让全世界看到人工智能实实在在的效益。”他说,人工智能规模化应用有三大标准:要有真实的看得见摸得着的实际应用案例,能够用统计数据说明人工智能的应用成效,能够基于典型应用场景自我进化。
“比如,科大讯飞做的智医助理,已在安徽四县一区规模化使用,当病人在跟医生对话时,智医助理可以自动生成对疾病的判断,供医生参考,辅助诊断近千种疾病,每天产生1.6万条诊断意见,科大讯飞可以明确看到它如何帮助一线乡镇医生提高诊疗水平。”刘庆峰说,未来医疗、司法、教育等诸多领域都可以看到科大讯飞更多规模化应用的案例。
作为从校园中走出的技术创业者,刘庆峰对创业者说,技术的应用场景非常重要,如果仅是技术概念,看不到清晰的落地应用场景,而且不能利用特定场景中的用户使用数据形成良性迭代、不断优化效果,就很难持续发展。一定要把概念落到实处,靠概念忽悠的时代已经过去。
攻关技术难点
刘庆峰说,在人工智能部分关键领域,我国距离世界一流水平还有差距。科大讯飞必须加强在人工智能源头技术创新上的投入,现在是人工智能原始技术创新突破的难得窗口期。具体方向上,刘庆峰建议,一是加大数学基础原理研究,创新数学统计建模方法。数学基础原理研究是人工智能基础研究中的重要组成部分,脑科学研究和数学统计建模方法深度结合,将是人工智能下一步发展的突破方向之一。二是加强脑科学基础研究,脑智同飞带动人工智能技术发展。脑科学研究是人工智能基础研究的重要方向,也是让机器从“能听会说”到“能理解会思考”的关键一步。
刘庆峰解释,现在人工智能算法还有局限性,比如无监督训练很难实现,机器学习还不能像小孩子看了少量数据马上就能触类旁通,无监督训练需要数学基本原理突破。
科大讯飞正在围绕人工智能技术创新布局,刘庆峰介绍,一是围绕语音和语义技术,满足万物互联时代的技术要求,二是突破自然语言理解,三是脑机接口,比如用意念控制家电开关。“现在最大的问题是,脑电波的检测还没有找到特别好的方法,如何能在人们无感和无损的情况下进行脑电波监测,一旦这一点实现突破,通过类脑计算和模拟人类神经元的传导机制,就可以形成人工智能技术重大突破。”