科大讯飞董事长刘庆峰:人工智能是大潮将至,还是概念泡沫?

来源:科大讯飞  作者:收藏
2016-11-29 09:03

11月23日,科大讯飞举行2016年度发布会。在发布会上,科大讯飞董事长刘庆峰作了主旨演讲(文末附演讲视频)。值得一提的是,在其演讲过程中,科大讯飞旗下产品“讯飞听见”进行了实时语音转写,并以字幕形式呈现出来。

以下为演讲内容:

今年是人工智能正式提出60周年,去年12月21日,科大讯飞举办“AI复始,万物更新”年度发布会。一年以来,可以说2016年已经成了中国人工智能的历史元年,伴随AlphaGo和李世石的围棋对决,人工智能更是引起了社会各界的高度关注,不仅是科技界产业界,包括所有的创业者和投资机构,媒体和普通百姓,都在津津乐道人工智能。全球范围内对人工智能的普及和关注,一年来热度居高不下,人工智能一直处于热点,处于风口浪尖之上。

人工智能是不是也像前两次产业大潮一样,很快退去?是真正的产业大潮?还是概念的泡沫?
其实要解答这个话题,我想首先要有科学的精神,要用理性的思维来真正看今天我们的技术,到底可以达到什么样一个阶段,而不是用预言家的角度非常感性的来做武断的判断。
人工智能在1956年的达特茅斯会上被提出来时,就是有着非常严谨的科学基础的。当年在达特茅斯会议上,是一批数学家、计算机专家、通讯专家共同提出的人工智能概念,其中包括麦肯锡、明斯基、香农等等。这些大科学家们很多都是图灵奖、诺贝尔奖的得主。人工智能概念被提出来之后,在1970年第一次浪潮达到顶峰时,就已经通过第一代的人工智能神经网络算法证明了《数学原理》这本书中的绝大部分数学原理。第二次浪潮发生在1984年,当时霍普菲尔德网络被推出来,让人工智能的神经网络具备了历史记忆的功能。
前两次的大潮后来都破灭了,为什么?是因为神经网络本身算法的局限性,同时也受到当时整个运算能力的一些限制。那么今天的第三次浪潮,以深度神经网络为基础,基于大数据、云计算运算平台,再加上移动互联网源源不断地把各种训练数据收集到后台。今天我们认为,以目前的时间节点,人工智能的第三次大潮已经切实到来了,它已经不再是一个概念,而是可以进入各个行业。
今年3月9号AlphaGO跟李世石对决之前,两会期间几十个媒体采访科大讯飞,当时,基本上业界、舆论和专业界,绝大部分人都认为机器今年很难获胜,但是科大讯飞很坚定地说机器一定大比分领先,为什么?因为围棋后台的算法是基于深度神经网络,这个神经网络其实科大讯飞早在今年之前就已经在很多领域取得了很好的应用成效,全球的科技产业界也做了很好的探索。谷歌(DeepMind)是把它用到了一个大家都很关注又喜闻乐见的围棋领域,这个算法和围绕它的科技和产业界持续的创新,推动了今天人工智能第三次大潮的到来。
2006年,深度神经网络的基本理论框架正式提出来,2011年就开始在语音识别领域崭露头角,科大讯飞是中国第一个把深度神经网络用到语音识别领域的。
2010年,我们在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。
2011年,可以看到2012年在图像识别中,深度神经网络开始异军突起,14年机器翻译取得突破……
今年,我们即将让大家看到一个又一个行业的令人欣喜的成果。
让机器能听会说,首先要给机器装上一个人工的嘴巴。今年,在全球的语音合成大赛暴风雪竞赛中科大讯飞再次获得第一名。今年的比赛比的是英语合成,而且是英语的故事级合成。小说和故事,也就是要求更加深情并茂,难度更大。在诸多国际的顶尖研究机构和产业界精英全部参加的前提下,科大讯飞再次在英文领域获得全球第一名,而且不仅是全球第一,是全世界唯一把英语合成做到了超过普通人说话水平的公司!
比赛中,五分是播音员的水平,四分是普通的说话水平,而今年的国际英文大赛科大讯飞得分是4.2分,第二名只有3.9,也就是说,小说风格,故事风格的语音合成,只有中国人做到超过了普通人的水平。科大讯飞连续11年蝉联了全球语音合成大赛的第一名。
当前的中文、英文、印地语的第一名都是科大讯飞代表中国做出来的。我们中国人、中国用户享受了全球语音合成最高水平的成果。
去年12月21日科大讯飞年度发布会上是全球第一次敢于在几千人的会场演讲环境下把语音自动转成文字。机器在转写准确率上大大超过了专业速记人员。
在讯飞2015年发布会之后,2016年5月份谷歌开始发布英文转写,国内也有一些公司开始跟风,即便到今天,能够任意人不用做任何训练,能够在不用联网的单机情况下,满足保密和网络的各种不同环境下,能够做到百分之九十几的准确率,全行业到迄今为止只有科大讯飞一家。
去年我们还发布了万物互联时代最重要的人机交互的几个关键特征:一、远场识别,在3到5米,5到8米之外,用语音跟机器人、智能家居交流;可以多轮对话;上下文可以随时随地打断。我们定义了万物互联时代的语音交互标准,并且推出了人工智能人机交互平台AIUI,平台当时以叮咚音响为应用代表,不光可以听音乐,可以控制所有家居。
今年5月份,谷歌发布会也推出来了类似的产品谷歌Home。我想这是万物互联时代,业界英雄所见略同。但是我想更进一步告诉大家,面对未来真正的万物互联,我们中国企业不再仅仅是在跟风,而是要引领和推动整个产业的到来。
国际上有一个非常著名的语音识别比赛,在噪音口音和多人情况下进行,那就是CHiME国际语音识别大赛,这个比赛的研讨会今年就是在谷歌公司举行,我很高兴告诉大家,几乎全球顶尖机构全部参加的情况下,科大讯飞在所有3项指标中都是全球第一名。而且,在六麦克风这个最难的麦克风场合下,我们的准确率依然高于97%,在噪音环境下我们的错误率只有2.24%。这些的识别技术,都会真正的推动我们整个产业的革命和创新。
2014年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展,国际口语翻译大赛 IWSLT获得英汉和汉英两个方向全球第一,这个第一是具有历史意义的,以前国际翻译大赛汉英方向是日本研究机构全球第一,英汉国际比赛是美国机构全球第一。2014年11月的比赛,终结了这个历史。在这基础上,2015年2月,美国国家标准技术研究院也就是NIST组织的机器翻译大赛中我们依然是全球第一,今年,我们又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译,今天现场大家看到两边屏幕上不光有中文,对应的还有英语、韩语、日语、维语翻译。除了维语,我们也做了藏语。未来我们要把世界所有主要语种全部放进去。
认知智能领域去年发布会上,我们告诉大家人工智能未来的核心是认知智能,以语音和语言为入口的认知计算是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的认知计算领域,又取得了令全球瞩目的成果:参加国际高知名度的Winograd的认知智能的测试,获得全球第一名。这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关。
当机器具备了这样基本的认知判断能力,就可以真正的在一个又一个的领域来学习人类最顶尖专家知识。所以在2016年科大讯飞获得全球第一名,是对中国人工智能历史有标志意义的。
今年的11月15号,由美国国家标准技术研究院NIST的组织的国际非常知名的认知测试Knowledge Base Population大赛,科大讯飞又获得全世界第一名。
国际知识图谱构建大赛(KBP)始办于2009年,由美国国家标准与技术研究院(NIST)主办,是国际上影响力最大、参赛队伍最多、水平最高的科技赛事。实体发现与链接(Entity Discovery and Linking Track)作为该项赛事的核心任务,需要从目标文本中抽取命名实体,并将命名实体链接到已有的知识库上,具有很高的技术挑战性。该任务受到学术界和工业界的广泛关注,历届参赛单位不仅包括IBM、美国卡耐基梅隆大学、美国伊利诺伊大学香槟分校等国际一流科研机构。这些认知成果都是真正的,在国际顶尖舞台上证明了我们中国人在人工智能领域已经不仅仅是一个科普、科幻或者带有所谓先知角度的感性判断,而是在踏踏实实做理论创新。
科大讯飞跟教育部考试中心合作,把人工智能用在事关国家教育未来的考试阅卷中。这个技术的突破和进展不仅仅是在教育领域的应用,它可以用在医疗行业、在法院系统。比如学习了最高法院科技法庭大量的司法大数据,可以对一线法官的判案形成非常大的参考和助力,甚至说可以超过人工。
因为有着无限互联网传输的不断的学习训练的数据,有着云计算无比强大的运算平台。人工智能今天的技术水平,在学习了顶尖专家知识以后,将来就能达到一流专家水平,从而超过90%的普通专业人,这就是我们面临的这个时代的趋势。
这不仅仅是科大讯飞的判断,我们可以看看一些行业方面的趋势分析:去年10月份麦肯锡给出的报告认为,将来45%的知识活动是可以被自动化的。科学杂志,在今年年初给出的判断是,到了2045年,将有全球50%的工作岗位由人工智能的机器来替代,而在中国这个数据是多少,是77%。大家可以想一想,也就是说鼎鼎有名的科学期刊认为,未来的30年之内,在中国每4个工作会有3个由人工智能来替代。这是它的预测,但是我想说的是,这时间还会大幅度提前。
人工智能今天的技术水平,在学习了顶尖专家知识以后,将来就能达到一流专家水平,从而超过90%的普通专业人,这就是我们面临的这个时代的趋势。当然在源头创新上,科大讯飞继续基于数理统计、神经网络基础上做算法的突破和创新,我们同样还跟一批顶尖医疗机构以及心理学、认知学的专业机构科学的研究,希望在脑神经的传导机制上找到突破,但今天我想说的是,就用科大讯飞已经达到的深度神经网络和我们的创新成果,结合移动互联网大数据这一些已经配套成型的产业框架,我们已经可以改变一个又一个的行业,这时代已经到来了。
所以今天,人工智能已经不仅仅是一个企业、一个行业的事情,事关我们今天在座的每一位。在这个过程中,我想跟大家说的是,今天人工智能+的时代已经正在到来了。这是不可逆转的最大国际趋势。科大讯飞研究院通过多年来对人工智能的研究,得出了这样的人工智能技术进化路径:
第一类问题称为Information-complete,这一类是给定的输入信息是充分的,可以完全由输入决定输出。包括目前的语音识别、图像识别等问题。
第二类问题称为Information-Incomplete, 给定的信息不充分,不能完全由输入确定输出,需要结合一定的背景知识或其他信息来共同、动态的决策输出,这些信息包括:事实(Facts)、逻辑(推理)、常识(社会信息)等。
第三类问题称为Information-Free,几乎没有给定的输入信息,需要“无中生有”的产生输出。如基础科学研究、创作等。
人和机器是一个什么样的耦合模式呢?对一个人来说,比如说我本人在这有一个,我的助手机器人。当然未来人工智能不仅仅表现为阿凡达、大白这样的机器人,它可以是无所不在的一个后台,处处为我们服务,像水和电一样,这就是互联网+时代的到来。那么对于我们每个个体人工智能的服务,也许今天它只能做10%的服务,但是我每完成一次,我每做一次,机器就可以学习,3个月或者半年,它又可以做到20%,三年他就能做到80%甚至90%,这就是机器后台的迭代学习。今天我们的翻译为什么已经达到大学六级的水平,出国的衣食住行基本都没问题了,就是因为有几百万人不断的使用,每天几百万就不断使用,他不断地学习、迭代,所以人工智能和人类耦合是不断的学习你的知识,分担你的劳动。
未来的世界应该是由顶尖专家和顶尖管理者协同管理人和机器的联合体的一个大未来,这就是我们认为的人机协同的机制。人类今天的工作会越来越多的由后台的学习系统不断地学习到机器中,由机器来代替我们,我们释放出来,想象更大的未来,去做更有创意的事情,这就是科大讯飞,我们认为今天的人机协同机制,而在这样一个人机协同机制下,人类智慧大爆炸时代正在到来。
人工智能云平台上的总用户数,今天已经达到8.9亿。比去年同期增长48%,8.9亿是什么概念?过去18个月,累计下载人工智能相关应用的独立终端,如果一个手机装了3个跟讯飞人工智能相关的应用,我们只算一个,过去18个月,累计已经有8.9亿不同的终端,因为中国人一年半换一次手机,那么第二个更重要的数据是,每天有多少人在用,一个人用一次叫一人次,去年这个时候每天是10亿人次的访问量使用量,今天,已经突破30亿人次。4月26日习近平总书记,亲自亲临视察科大讯飞的技术成果,当时他非常高兴的看到我们每天的数据量是15亿人次,短短半年到了30亿人次,我们认为很快会突破百亿人次,围绕我们的第三方创业团队,去年有7万家,现在已经达到21万家,这就是人工智能的产业生态,我们希望跟所有创业者共同成长、共同创造、共同分享人工智能的伟大未来。
新的人工智能时代的创业者,由于独特品位和创造力,会很难被其他的巨头用资金、用数据和入口来血洗出去,所以在这时代,我们更要强调打造人工智能的产业生态,每一个创业者也更拥有前所未有的历史机遇,科大讯飞在去年发布会上,把我们的平台开放给所有创业者以来,我们可以看到一些令人鼓舞的数据进展。
在今天这时代,大家都更加的高兴,我们更有想象力和创新空间了。其实各国政府也在高度关注,今年1月份日本就正式提出来“超智能社会”的发展规划,10月13号,美国正式出台了人工智能产业规划,而且专门出了一本教育美国民众如何面对人工智能未来生活的这样一个专门产业规划,包括科技产业,人文和伦理。我们在中国,习近平总书记在G20会议之前的工商20国峰会上,把科技创新提到了前所未有的高度,但是点名的产业,只有人工智能和虚拟现实,认为这些技术会给未来的生产和生活带来革命性的变化。
中国其实在今年的4月8号,就已经在工信部的指导下,科大讯飞跟华为等众多企业一道发布了《人工智能深圳宣言》,这个宣言中,特别强调了人工智能首先必须强调源头技术创新,因为必须在核心技术上拥有话语权,你才会在未来的产业上有布局的优势,第二,必须强调人工智能产业生态,第三,必须要有标准体系。
讯飞开放平台上就有21万家的合作伙伴,在各个领域,光智能家居从音箱到台灯到各种灯光到电视到冰箱和空调,几千种在研发,未来如何使这些设备互联互通,如何节约我们有效的社会投资,避免浪费?标准体系是当务之急,科大讯飞已经对人工智能的标准从技术到训练到行业应用以及饮食安全测试,给出了完整的体系,也给国家提交了一系列的标准和规范的要求,我觉得这是对未来产业发展至关重要的工作,今天我们已经开始行动起来。
这是今天必须考虑的,科学杂志说未来30年之内,今天中国每4个工作在中将有3个以上被机器替代,那么当旧的工作岗位被替代,新的岗位还没有创造出来之前、社会财富将很有可能在相当一段时间内由少数顶尖人工智能公司集中创造,也就是说社会上绝大部分财富可能会由少数的顶尖人工智能公司来创造的时候,社会的财富分配体系,社会的救助体系和法律保障是什么样的?
这个时代比想象的还要更快的到来,我们每个人都要为它的到来做好法律上准备。未来人工智能是服务我们人类的,不是颠覆和主宰人类,我们的伦理、人文上有一系列要研究的地方。
今天人工智能绝对跟每一位社会民众,每一个企业,从中央到地方的政府都是密不可分的,因为它已经不仅是一门科学和一个产业,更是一个伟大的历史进程,涉及到了社会方方面面,从技术、产业、法律到伦理和人文。
今天全球产业都面临着转型升级压力,也是动力和机遇。中国制造“2025”,这是未来中国制造业、中国产业发展非常重要的指南。我们认为中国制造2025一定要跟人工智能匹配在一起,如果只有中国制造,未来产业的水平较远远跟不上时代的需要。改革开放30年,我们创造了经济上的奇迹,但是,真正在全球产业链上,我们是处于价值链的底端的。
未来30年,新的双创时代到来的时候,如果我们抓住了人工智能产业机遇,我们将会在全球的价值链中有更大的话语权和影响力,如果我们丢掉人工智能话语权,我们将继续给全世界打工,这就是我们面临的现状,所以一定要把人工智能和中国制造,提到双能驱动、并驾齐驱的战略高度,要让人工智能上升为真正的国家战略,绝不是一个企业一个行业的事情,事关国家和民族全局的事情。
今天人工智能在中国拥有前所未有的良好机遇,有社会各界的高度关注和认同。以科大讯飞和我们的众多合作伙伴为代表,我们在源头核心技术上已经处于全球的顶尖水平,我们还有众多的产业伙伴共同形成的产业生态。 
所以,我相信在人工智能第三次大潮到来之际,我们大家是能够共同携手努力,不仅通过人工智能为中国产业的未来为社会的进步作出贡献,也可以为全世界的未来做出更大的历史功绩。未来,希望我们能够齐心协力,精诚合作,让我们共同在中国用人工智能改变世界。
 

查看所有评论