7月9日,2020世界人工智能大会云端峰会正式开幕。科大讯飞董事长刘庆峰在“产业发展全体会议”上发表主题演讲《用人工智能点亮人间烟火》。
7月9日,2020世界人工智能大会云端峰会正式开幕。科大讯飞董事长刘庆峰在“产业发展全体会议”上发表主题演讲《用人工智能点亮人间烟火》。
以下为演讲实录:
很高兴再次来到上海,跟大家分享关于人工智能最新进展和我们的一些判断。今天在这里看到会场人头攒动的情形,我不禁想起在疫情期间网络上流传的武汉的一张照片:照片里是空无一人的街道和冷冷清清的大桥,下面配文是我们多么期待车水马龙的人间烟火。
所以我今天的题目是“用人工智能点亮人间烟火”。不仅仅是用人工智能抗击疫情,提高我们的医疗能力,同时也是用人工智能更好地支撑我们未来的复工复产。在越来越多的危险岗位上,可以用人工智能更好地完成工作,点亮人间烟火。
现在大家都有个共识,人工智能早已从核心技术的算法创新的关键时期,到了典型行业的试点应用突破,现在开始进入到大规模应用阶段。当然,这个大规模应用阶段的关键,我认为就是它能否解决社会刚需。如果今天我们说的人工智能仅仅是可有可无的应用,我觉得它一定是没有生命力的。但如果是解决社会刚需,它一定会有巨大的内驱力。我想给大家分享几个例子。
比如医疗领域,2017年科大讯飞的智医助理机器人通过了国家执业医师资格考试,在疫情到来之后,迅速的学会了新冠肺炎知识,并用这个系统在全国范围内对200多万的基层医生进行了培训,让大家充分了解了新冠肺炎的基础知识。
另一方面,利用我们的智能语音技术来帮助社区进行全面排查,整个疫情期间,在全国累计服务了5900万人次。现在韩国也已经正式上线,经过韩国福祉部认证以后,在全韩国70%以上的城市已经覆盖使用。不仅声音惟妙惟肖,在回答的过程中也不知疲倦,并自动进行统计,电话结束报表就出来了。这就是人工智能非常显著的一个应用成效。
教育领域,整个疫情期间讯飞“停课不停学”解决方案支撑了20多亿人次的上课和作业,但是我们发现线上上课,孩子们最大的问题是在线不在状态。因为老师不像现场可以关注他是否认真听课,不像在现场可以对他提问,让他得到表扬,让他觉得受到关注。所以导致孩子们在家里可能在学习的时候,在干别的事情甚至打游戏。
在这过程中我们推出人工智能“七步法”:自动用人工智能判断孩子们预习和头一天作业的情况,告诉老师课应该怎么讲?讲课过程中用人工智能自动分发,以老师的名义给孩子们在每一个段落之后分发作业,孩子们做对了给他小红花,做错了善意的提醒,他感觉是在被老师全程关注的。甚至朗读课、英语课、音乐课孩子有没有跟上,有没有跟读,人工智能都可以自动判断。
我们有一个非常有意思的测试,线下上课孩子们在这一类的测试题中平均做对的是60%,线上上课只能做对42%,而用人工智能“七步法”在线上授课,因为有更多的过程化数据,它不到一个月的时间就可以把准确率做到69%。比线下上课,对于知识的学习,知识点的掌握还更高。
我相信未来线上线下一定联合起来成为新常态。而且名师可以通过线上给更多的孩子去讲课,所以这也是一个非常典型的,没有人工智能能够自动批改作文,自动在数理化上进行知识图谱的推荐,是不可能做到这个效果的。这些技术的进步,使得我们人工智能助力教育“因材施教”成为现实。
司法领域,在上海我们做的刑事案件智能辅助办案系统,从当年的杀人案、盗窃案、非法集资案和电信诈骗开始,现在已经覆盖102类的刑事案件,罪名已经常态化使用,用人工智能自动进行证据链的校验,以防止冤假错案,防止证据缺失和自相矛盾。同时给出罪行、罪名和量刑的建议,现在已经累计完成了案件超过10万件。所有刑事案件常态化进入了,那么也已经开始进入到民事和商事领域。
今年“两会”《民法典》发布,《民法典》以及我们现有的法律体系如此之庞大。上千条法律条文,普通老百姓如何了解和认知将来我们在某些关键事件碰到的时候,我们知道对应的哪一条吗?所以在5月28号“两会”结束后,29号我们就跟检察日报共同推出来的微信的小程序,直接在小程序中进行查询,你告诉它你碰到的情况,它就会直接告诉你所对应的法律法规以及类似的,别人的案件是什么样的,类案是怎么处理的?那么极大的推动了我们整个法律的落地。
智慧城市领域,因为疫情的隔离,老人在家无法看护,如何用人工智能让城市更有温度呢?举例来说,我们拿到整个城市的大数据,有了水电、煤气这些信息。我们就可以自动判断这些老人,他如果24小时没有用过水,没有用过电,没有用过煤气,我们就会用人工智能主动拨打电话去关心问候他。如果他回答了没有问题我们存档,如果不回答或者有问题,再通知他们的亲属上门,隔了一段时间如果亲属没有去,再让社区人员上门,可以把我们的社区工作效率以百倍的比例向上提升,使得整个城市更有温度。
对于一些特殊的群体,比如盲人和聋人朋友,科大讯飞在2017年启动了A.I.公益计划,我们到去年年底惊喜的发现,围绕我们人工智能开放平台,给盲人和聋人的朋友做无障碍应用的第三方创业团队竟然超过了1000个团队,我们的APP每天有超过5000万人次在使用,让盲人能够“听得见”文字,用语音合成读出来,让聋人可以“看得见”声音。
我相信这些应用,只有真的立足于场景解决刚需,才能更好地大规模推广和普及应用。但是今天的人工智能绝不是只要有数据,就能够解决人工智能应用问题。绝不是说拿一个深度学习的开源代码的模型,随便一个团队训练就能做成。
人工智能是一个强技术领域,它的发展方兴未艾,我认为还有五大关键创新点:
关键创新点一:更少的数据实现更大规模的应用。以机器翻译为例,科大讯飞的翻译机已经有将近60个语种的翻译了,可是有很多小的语种,我们很难找到对应的翻译的语料工具去训练。可是我们在过去一年中发现,我们其实可以通过前向和反向数据增强的半监督训练,200万对的双语语料,就可以达到传统的2000万的数据效果,所以我们在翻译领域可以迅速突破。
语音合成也是这样,现在最短的5分钟就可以模仿一个人讲话,如果大家买了讯飞的故事机回家,你训练几句以后就可以用你的声音给你的孩子讲故事,用你的声音给你的父母亲读书读报。这些都是关键技术的突破,没有这些突破,光靠一个深度神经网络模型,根本解决不了这个问题。
关键创新点二:让数据驱动更有效,动态自学习模型。人工智能一个非常大的问题就是说我训练的数据太多了,它就会形成过拟合。举个例子来说,今天是安静场合,我大量的训练数据过来了,结果我到餐厅以后,噪音场合下它的识别率反而会下降。
如果我用了噪音场合下数据,又用了汽车上的数据,用了餐厅的数据,就会在安静情况下,它的识别率会下降,叫过拟合,如果我学习刘庆峰的声音,明天又学习张文宏的声音,对我的识别率提高了,对张文宏就会下降,对他提高了,对我就下降,所以大家很痛苦,我怎么样使得训练的数据越多,又能够个性化对应,所以在这个过程中,我们提出来是基于多环境因子嗅探的动态模型延展,我一边识别一边来判断他的口音,一边来判断环境,从而挑到最适合的环境,从而使得我整个语音识别过程中,你后端不管有多少语料,对我都只有增强,没有减弱,努力达到这样一个效果,也就是说让数据驱动更加有效。
包括我们的翻译,今天我在物理环境中的翻译做得更好,到化学中可能识别就会下降。我在天文学中做得好,可是在生理学或者在日常生活中就会下降。怎么样把这种专业领域的先验知识,由我们的系统自动在翻译过程中进行模型的动态训练,使得我现有的各种数据既能服务于我的效果提升,又防止过拟合,非常多的新的算法在这里面。
关键创新点三:跨语言迁移学习。今天全球的一体化是大势所趋。我们说人类命运共同体首先要进行语言的自由互动。那么如何实现多语言?其实我们现在说跨语言的迁移学习,也是下一步人工智能特别关注的,如何基于语种相似性,能够让很少的语料就可以更好地实现语音识别的效果。
举例来说,俄罗斯语我们已经做得很好了。我在做德语的时候,就可以把俄罗斯一种大量的信息用在了德语中。因为从同一个语系,我们在维语中取得很好的效果,在阿拉伯语中就可以迅速取得很好的效果,这就是语种相似的迁移学习。
那么,今天我要做一个以汉语到其他语言的翻译,语料不够的时候,我们还可以借助英语作为桥梁来进行学习。很多的这些方法我不展开多说。在明天的教育分论坛上,大家可以看到讯飞听见会有法语、日语、韩语等多语言的自动翻译。
关键创新点四:离线隐私保护。今天我们都在讲人工智能的伦理,其中一个非常重要的叫做隐私保护。我们觉得不光是法律的问题,也要给用户更多的选择权。所以大家可以看到说我们科大讯飞支持了言知科技下面的自研芯片,只要用28纳米的相关的芯片,就可以实现最好的语音的识音。所以他在芯片的源头上不会被卡脖子。
另外翻译机、家庭的控制器、家庭音箱都可以做成纯离线版,现在很多人在家庭用一个音箱来交互,我听到很多高端人士都说我有点担心,我怕我在家里窃窃私语,我家里的话全被音箱给听走了。我们跟海尔推出了一个纯离线的家庭控制中心,可以听音乐,可以控制家庭所有终端,但它不联网,充分保护用户隐私。所以今天的离线隐私保护也是技术发展的必要的趋势。需要算法持续的优化,加上我们对算法效果优化的同时,进行算法的运算能力的大幅裁减,才可以使得我们跑在更多的芯片上,才可以更好地存储,就可以在一个离线上,满足用户的各种使用。
关键创新点五:情感计算让数字化生存更加人性化。我们如何通过情感计算,让数字化生存时代更有人性化?这里需要用情感计算来判断,比如,我们刚才给大家看的电话随访,你要保持一个愉悦的心情。同时根据对方的反馈,他如果发热了,你要表示关切。如果他饮食不习惯,你甚至一定要像对孩子一样,不同的对象表达的情感是不一样的。在这个过程中有非常多的工作要去研究,那么从情感计算本身,从心理学的研究本身,如何使得我们未来的人工智能更加像人一样具备同理心,我觉得这是非常重要的,有一系列的算法,也有一系列的人文的科学,我们要展开。
所以我想只有围绕着这些更少的数据学习更好的效果。那么能够使得数据自我驱动更加有效,而不至于过滤和如何解决多语言问题,如何解决饮食问题,如何解决情感人性化问题,我觉得这都是今天我们人工智能点亮人间烟火特别需要关注的技术方向。而我非常高兴的告诉大家,我们踏踏实实走在我们的原创技术的前进道路上。
疫情之后,我相信中国在2017年所制定的人工智能三步走的国家战略,一定会如期实现。数字生存时代,使得我们的人工智能所依赖的学习数据比原来更加丰富。同时因为疫情的管控体系,使得我们的数据积累管理和汇聚比原来更有效,也能证明我们能够在保护用户隐私的前提下,服务于人工智能建设美好世界的过程。
社会各界对人工智能需求和呼声越来越大,所以我相信未来十年将是属于人工智能的新十年。这个新十年的标志是:
第一,用人工智能可以真正地给民生事业补短板,解决社会刚需问题。
第二,可以用人工智能赋能每个人,让每个人因A.I.而能。提供无所不在的人工智能能力,让每个人都站在人工智能肩膀之上,使得人工智能的能力对每个人来说都像水和电一样触手可及。
第三,人工智能通过核心能力,依据情感和人文的不断牵引,全面支撑并引领线上和线下相结合的未来十年的数字化生存。