张钹院士:第三代人工智能的发展是怎么样的?

发布时间: 2021-09-28

导读

习近平总书记在2015年提出,人工智能是新一轮科技革命和产业变革的重要驱动力量。人工智能为什么受到这么大的重视?第三代人工智能带来的安全问题,现在究竟能不能解决,解决到什么程度?让我们在下面的文章中一探究竟吧!

人工智能产业变革究竟起什么作用?

从金融行业的例子来看,在最早的时候银行利用最原始的设备和技术,使用账本、算盘为用户提供金融服务。随着设备和技术的自动化、信息化,特别有了计算机、有了网络以后,金融的活动时间和空间大大缩短。活动时间的缩短意味着效率的提高。人和人之间的空间距离,行业和行业之间的空间距离,国与国之间的空间距离,也大大缩短。所以金融活动是在全球跨行业,任何时间任何地点都可以进行的。

首先金融的一个非常重要的变化就是用户和工作人员的交互,从面对面变为人机交互。这种交互带来很多便捷和好处,但是同时存在需要人工智能技术的问题。人工智能的引入首先就出现了安全问题,有一个互相信任的问题。

第二个变化是经济活动、金融活动的速度加快,规模加大。过去人类利用设备为用户提供更好的金融服务,在现代这种模式是不能满足要求的。因为市场的变化,金融变化太快了,为了适应这种快速变化,做出正确的决策,设备和技术也参与了决策和分析,带来另外一个可信不可信的问题。设备和技术提供的主意,做出的分析是否信得过,由人工智能来解决这个问题。所以我们实际上进入了完全全新的一个金融时代,这个时代就要求我们要建立一道互信的安全高效运行的系统,这就是人工智能带来的安全问题。

什么是人工智能?

人工智能定义为8个字:研究和设计智能体。研究说明它是一个科学,设计说明它是一个工程。人工智能既不是自然科学,也不是社会科学,而是一个技术科学。技术科学的任务是既要从事基础研究,也要重视应用。智能体概括了系统、机器、部件和软件。人工智能既要研究系统,也要研究元器件,既要研究硬件,也要研究软件。到现在为止全世界对智能没有公认的定义,因此人工智能是用机器来模拟智能的行为。我们看待机器自由行为的表现,从行为上跟人类相似,就认为这个机器是有智能。

人类的智能行为有4种:第一种是理性行为,包括思考、决策和判断等人类唯有的理性行为;第二种是感知行为,包括视觉、听觉和触觉等;第三种是动作协调控制,人类的动作行为是很重要的智能;最后一种是情感、敏感和创造性等更高级的智能。人工智能要做的就是用机器来模拟这4种人类的智能行为。

智能跟智能行为有什么区别?

用情感来说,喜怒哀乐至今没法下定义,这有待于脑科学和心理学来研究。在痛苦或快乐的情况下,人工智能研究痛苦或快乐的表现,所以研究人的动作、脸部表情、语言和博客去了解人的情感。至于内心的情感交给神经科学去研究,这个就是人工智能跟心理学和脑科学的区别和联系,如果后二者研究清楚了,人工智能会做得更好。人工智能模拟的是人类的智能行为,不是模拟人类的智能,因为智能行为是可观察、可测量和可评估的。因此可以通俗地讲,人工智能的任务就是要把4种智能行为变成计算模型。

第一代:符号主义(知识驱动)-理性行为

人工智能的第一阶段是努力去模拟人类的理性行为。第二个阶段是上世纪末兴起的深度学习,主要是模拟人类的感性智能。在2015年提出人工智能必须走向第三代。什么叫理性行为?理性智能粗略地讲就是通常的智商,做任何工作主要靠的是理性智能。理性智能来自知识和经验,还有运用知识的能力(由此及彼由表及里的推理能力)。

人工智能的计算模型就是把知识库、知识经验和推理机制放进去,如医疗诊断系统可以描述成这样一种计算模型。把医生的知识和经验,医生的推理过程放在计算机中,通过各种症状去搜索患了什么病,然后去搜索应该怎么治疗,其中需要有知识和经验来引导,才能够搜索到需要。

这里举例创作加深对计算模型的理解。创作出七绝一般4个句子,每个句子是7个字,在10万个字中任意挑选出字做出诗是几乎可能的事情。计算机通过优化中间的词进行交换变化,用词的搭配、押韵等约束条件进行约束,最终用遗传算法可以做出来诗,但是存在语义上的矛盾,这就是计算机跟人不同的地方,因此现在很多遇到的困难都是处于计算机不了解的局面。作曲是在4个参数里进行选择:音高、音长、音强和音色。计算机能做的是音高和音长,去分析已有音乐的规律,然后根据这个规律去做类似作曲家的举措,所有的专家都认为计算机做的比人做的音乐好。因为音乐没有语义要求,是最抽象的艺术。计算机搜索的能力要强得多,没有语义要求的计算机做起来就比较容易,可以搜索出来过去没见过没听过的东西。人物画是有语义的比较困难的,计算机用这计算方法来画的水平是儿童化水平或原始人水平,换句话讲是计算机画画水平很低,因为有人物画的要求。因为传统的信息处理是处理信息的形式,所以说这是人工智能很重要的一条能力。人工智能必须要涉及到能力,这也是所有的困难所在。

这个问题可以总结一下,用这一套办法能做好什么东西,才能够超过人类?举国际象棋为例,计算机可以超过人类。下国际象棋靠的是理性行为,一共64个格,每个棋子的职责和走法不一样。限制越多越严,对计算机来讲越简单越明确,越是更好解决的问题。而且计算机是理性分析问题,可以讲出因果关系,所以在这样一个问题上计算机依靠三个要素,即经验知识、算法和硬件,就能够战胜人类。

人工智能系统在它的强项上绝对不是为了代替人,而是充分地利用人类的聪明才智,发挥了人类聪明才智的作用,所以一定要注意人工智能是以人为本的。计算机凭借其速度和存储量是绝对有贡献的。因此以人类的智慧为主,在计算机的帮助下充分发挥人类智慧的作用,有这样的思路就可以做很多事情。

这里特别说明为什么计算机要作为辅助,而不能单独做事。比如挂计算机号开出药方,将来这个药方错了,涉及责任的问题,最后签字的是医生;无人自动驾驶,不光涉及技术问题,还涉及到伦理道德法律。乘客跟司机是命运的共同体,而计算机完全不同。所以大多数人工智能产品都在实验阶段,真正使用的比较稀少,涉及较多的问题。

这是人类的各个方面的智能,不仅仅支持视觉听觉,包括感性直觉、想象都是如此。如徐悲鸿画马跟这个道理完全一样,用的不是人工神经网络而是用大脑神经网络,所有的马在这里都有编码,然后通过回放采样画出来的马是世界上没有的。这就叫创作。

GPT-3的一个特点就是模型特别大,它学了3000亿的词,比人一生看过的词还多100倍,也就是网上基本上能够获得的文本,通过一翻整理再去掉重复。这个学法实际上是用前文预测后文,建立一个条件概率分布模型。随便写一段,它便往下续,续的很合理也不是胡说八道。把它写出来的跟人类写出来的区分,相当一部分都分不清楚。

第二代:连接主义(数据驱动)-感性行为的模拟

连接主义就是感性,是另外一项非常重要的内容。感性的知识来自合作。两岁以前的孩子要完成4项极为重大的任务:一是观察;二是倾听;三是动作;四是情感交流。这4项任务就是人工智能要做的4项任务,也是人类的4种智能行为。所以两岁以前是为以后的智能发展打下基础,这是一个非常短暂的窗口,孩子的智商会受到极大的影响。

现在把计算机应用叫机器学习。所谓训练就是监督学习,现在计算机做的更多是有监督学习,人类早期学的时候是无监督学习。等孩子能听懂讲话后会给事物打上标签,因为头脑里已经有了模型。所以现在所谓深度学习就是用这套方法,而且也是用神经网络模型,这样就可以跟人类的神经网络进行对照。从数学上来讲实际上就是函数拟合,但是也可以做成一个神经网络。不管语音还是图像都可以用大数据来呈现效果。最重要的是原始数据输入进去,而不是要提取特征,这就使得工具的技术门槛较低。过去做人脸识别要花很大的功夫,去研究抽取什么特征并做预处理,现在直接输入就可以了。有了深度学习发生了极大的变化。深度学习的优势在于:①不需要领域知识;②能够处理大数据;③好的性能(识别率不断提高);④可扩展性(处理大规模问题的能力)。

最说明问题的就是AlphaGo。深度学习和强化学习是第二位,第一位是思想观念的一个转变。好多人过去做围棋程序的时候,是作为理性分析的问题来做,全世界都是按照这个思路来做的,所以基本上做的最好结果是做到业务化。做理性分析是去咨询围棋大师,问他在这种棋局下,为什么把黑子放在这儿,他可以做解决。但是怎么告诉计算机?后来又找另外一个大师,问他同样的棋局,为什么把黑子放这儿,他又说了另外一种道理。于是醒悟过来,原来实际不是这么下的,是熟了以后凭的棋感,这在技术上就叫做直觉。所以按照这个思想去转变,问题迎刃而解,从业余到专业,从专业到世界冠军,到现在超过世界冠军。

所以这个问题总结一下是依靠4个要素。这个地方完全是计算机战胜人类,AlphaGo根本没有学人类的知识和经验,自己就从数据中学。这给了做人工智能一个非常好的思路,也一方面可以向人类学习对知识的使用,另一方面可以向机器学习对数据的使用。因机器为什么能够战胜人类在于机器处理数据能力远比人类强。所以有了这两条以后,就是做人工智能的希望,因为同时利用了人类的优势和计算机的优势。

关于动作控制的问题,机器人实际上是模仿人类的肢体动作,模拟动物的包括人造物的飞行。情感行为从三个渠道来表现:肢体动作,声音和脸部表情。所以做情感分析实际上是两项工作,一项工作叫做情感识别,通过在脸部表情、语言声音和肢体动作来判断情况,包括舆情分析等等。根据言论去判断对事情的态度,是赞成是反对,是喜欢还是不喜欢,所以这个工作是非常重要的,就叫情感识别或者叫情感分析,舆情分析也在内。另外一个就是把情感把它生成出来,所以做这个工作不是做情感本身。

人工智能技术存在的局限性

人工智能的应用场景需要满足这5个条件:1、具有充分知识或数据;2、确定信息;3、完全信息;4、静态(或按照确定规律演化);5、待定领域与单任务、不易推广。基本上都符合这5个条件才能做得好。

下围棋如果是完全信息博弈的话,不管多复杂,计算机绝对是最后战胜人类的。但是看起来很多东西对人类非常容易的事,对计算机来讲要注意。区分了马和牛只做到感觉,并没有做到感知,所以这个问题要充分体会它的困难,因为人工智能就是做那些人类做起来很容易,但是计算机做起来很难的事。解数学微分方程人工智能不去干,因为计算机已经做得很好了。计算机全是做那些现在这样就不好干的事,才叫人工智能。这个问题就是推说,起来容易基本上一做起来极难了。

医生看病用计算机为什么看不好?因为这个问题的不确定性。所以人类的存在,人类要解决的问题都是不确定问题,才需要人类。看病为什么难?就是有这些症状,发烧、感冒、发烧、咳嗽等等,有可能感冒,有可能肺炎,有可能是冠状肺炎,这样的病这个人就这么治疗,那个人就那么治疗。不确定性,到现在为止数学怎么描述?费了很大的劲,找了两个方法,一个叫概念,一个叫模糊数据。但是到现在为止,这两个工具都不足以来描述的内容所处的不确定的环境。因此要注意这个问题,现在的工作还是非常有限的,不要认为现在什么东西都解决了。因为所做的事情都是符合上面讲的5个条件。

人工智能还有一个非常特殊的问题,算法不安全,我们在信息时代没遇过。信息时代的不完全是大型软件里头的漏洞,是人民没弄好。人工智能不是人们没弄好,算法本身就是不安全的。所以这个一定要注意,这个性质非常不一样。自动驾驶的危险性就在这。所以人工智能的算法非常脆弱,非常容易受欺骗。

在智能上的一个最大的问题是缺乏自知之明。智能包括这两个方面,一个方面是这个人有学问,说明知道的越多,这只是一面,不是重要的一面,更重要一点是明白所不知道的东西更多,这是智慧的两个行业,计算机却恰恰是没有的,所以那些目空一切、自以为是人,要么学问不高,要么智商很低。人类没听清楚的话,会问这句话是什么意思,再重复一下。但是计算机不会,就是说什么话也不懂,这叫做无知,这叫做没有知之明,这也是智商低下的重要表现。所以一定要注意,比如看到越有学问人越清晰,因为他越知道自己不知道自己多,越没有学问的东西,这个人他越狂,因为他不知道自己不知道什么。

第三代:知识+数据驱动

所以上述问题就是要发展第三代人工智能的一个重要出发点。我们现在看信息科技的发展跟人工智能发展大不一样, 最主要的就是信息革命一开始理论基础全建好了。1936年图灵机理论,1948年的通讯理论,1948年的控制理论,三大理论都奠定了基础,按照这个理论指引的方向发展一路顺风,从来没有经过什么曲折,人工智能为什么这么曲折,因为到现在为止还没进入它的理论。虽然说第一代试图去建立一个模型和理论,但是它都有很多缺陷。所以这就是我们提出来的第三代人工智能最根本的问题。就是说如果这个问题不解决,人工智能今后的发展还是这个样子。所以在2015年就提出这个问题,其实思路也很清楚为三句话:①构建可解释与稳健的AI理论与方法;②发展安全可信、可靠和可扩展的AI技术;③推动AI的创新应用。

当然具体的思路就非常简单,下面具体做法有很多。充分利用这四个要素,即知识(放在第一位)、数据、算法、算力。第一代人工智能只用了其中三个,第二代人工智能只用另外三个。我们就强调必须同时使用这四个要素。现在大家很多地方很多夸大的数据的作用,让数据说话,这句话肯定有限制的,数据说出来的话不见得是对的,要看怎么去处理。所以这个里头实际上是让知识说话,知识就是力量,不是数据就是力量。

我们现在做的好多东西都靠数据。医学图像识别都是经过最高级的医生来标注,所以是最高级医生的水平,是超过一般医生的。所以说智慧医疗这个智慧指所有医学工作人员的聪明才智。但是不要以为有计算机以后医生没有责任,只能医生才能负责,计算机负不了责。

那么下面的这个方法就比较技术性,这里头还有很多难处。我们早已认识马,所以我们一看到就知道马在哪,但计算机看过去却不知道马在哪,于是就乱做了,把所有的举出来去比较看看哪个特征是不一样的。所以必须有最初设计的模型,如果没有模型的话,计算机绝对会这样,这在计算机视觉里早就讨论过这问题,那么这就是知识驱动。如果使得数据驱动更加可靠和可解释,那么做到的事就大的很多。这个全世界做的也非常多,目前我们在这方面应该做的是相对比较高,也比较前列。

现在的终端平台落后的比较多,主要问题是如何能够把数据加进去,因为光靠专家的知识是非常有限。现在必须得到国家支持,因为大公司都不愿意干这事。外部所有的基础设施,通用的支付计算平台都是大公司在干,过去是学校研究所在干,其根本的规模不是商业的规模,因此在这方面落后的还非常多。所以现在大公司不干,肯定要政府支持,因为基础设施如果不搞长远来讲要吃大亏。

总结来说,我们国家在1980年才进入信息革命,信息革命几乎改变了世界。那么我们介入的状况在于,所有的关键技术其他国家都已经完成了,所以我们觉得现在这么被动。现在我们赶上信息革命,但是因为在后期进去,必然出现这个问题。但是人工智能不一样,虽然60年中间经历过曲折,但是这只是序幕,正序还没有开始,就是我们说的第三代人工智能。我们只有从这个技术革命的一开始就是参与者、创建者,今后才有发言权,才有可能引领世界。我们必须要做出贡献,而且这个做法必须开放,跟全世界一起做,因为现代的技术不可能就一个国家做。

所以人工智能要靠各种各样专业的人来做, 需要各种各样的行业人一起来做。一个科学技术发展要靠大家。如果清华没有世界一流的数学,绝对没有世界一流的人工智能,人工智能需要其他领域的专业来落地。