张 钹:人工智能(néng)发展的回顾与展望
来源: 光明网-《光明日报》 作者: 发布时间: 2024-05-27

人工智能(néng)的两条路径

迄今為(wèi)止,全世界对于“什么是智能(néng)”尚无统一认识,但经过多(duō)年的探索,人工智能(néng)已然走出了两条道路。一条道路是行為(wèi)主义學(xué)派,另一条道路是内在主义學(xué)派。

其中,行為(wèi)主义學(xué)派主张用(yòng)机器模拟人类的智能(néng)行為(wèi)。“智能(néng)”与“智能(néng)的行為(wèi)”是两个完全不同的概念。“智能(néng)”在我们大脑里,人类至今仍对其知之甚少;“智能(néng)的行為(wèi)”则是智能(néng)的外部表现,可(kě)以进行观察和模拟。因此,行為(wèi)主义學(xué)派人工智能(néng)追求的目标是机器行為(wèi)与人类行為(wèi)的相似性,而非内部工作原理(lǐ)的一致性。目前人工智能(néng)的主流是机器智能(néng),这种人工智能(néng)与人类的智能(néng)只存在行為(wèi)相似,并非完全一致。内在主义學(xué)派主张必须用(yòng)机器模拟人类大脑的工作原理(lǐ),即类脑计算。这两个學(xué)派按照不同的思路对人工智能(néng)进行探索,前者主张除人类这条道路外,机器或其他(tā)方法也可(kě)以走出一条智能(néng)道路;后者主张走向智能(néng)道路只能(néng)依靠人类。目前这两种思路都处于探索阶段。

人类对人工智能(néng)道路的探索始于1956年。当时在美國(guó)召开了人工智能(néng)研讨会,来自数學(xué)、计算机科(kē)學(xué)、认知心理(lǐ)學(xué)、经济學(xué)和哲學(xué)等不同领域的10位专家经过八周的讨论定义了人工智能(néng)。他(tā)们主张通过符号推理(lǐ)、符号表示来做一个能(néng)像人那样思考的机器。在这次会议上,纽维尔(Newell)和西蒙(Simon)演示了一个名為(wèi)“逻辑學(xué)家”的程序。该程序用(yòng)机器证明了数學(xué)原理(lǐ)第二章中的部分(fēn)原理(lǐ),数學(xué)定理(lǐ)证明与推理(lǐ)相似,这表明机器能(néng)做类似推理(lǐ)的工作。最终,“人工智能(néng)”在这个会议上获得了定义。

1978年,清华大學(xué)成立了人工智能(néng)与智能(néng)控制教研组,这是中國(guó)最早的人工智能(néng)教學(xué)与科(kē)研机构。教研组有(yǒu)三十余位教师参与,其中绝大部分(fēn)来自自动控制领域,而非人工智能(néng)。1978年,教研组招收了第一批硕士生,1985年开始招收第一批博士生,已能(néng)够开展一些与人工智能(néng)相关的教學(xué)工作,但科(kē)研工作进展不大。1982年至1984年,教研组进行调查研究,访问了西南、东北等地大量研究所及工厂。结合所见所闻,教研组确定了以智能(néng)机器人作為(wèi)主要研究方向。

1985年清华大學(xué)建立智能(néng)机器人实验室,1986年國(guó)家设立“863”发展计划,该计划将智能(néng)机器人作為(wèi)一个主题。清华大學(xué)参加了第一届智能(néng)机器人主题的“863”高技术研究,从第一届到第四届均作為(wèi)专家单位参加委员会。到了第五届,清华大學(xué)成為(wèi)开展智能(néng)机器人研究的组長(cháng)单位,1997年,成為(wèi)空间机器人研究的组長(cháng)单位。“智能(néng)技术与系统”國(guó)家重点实验室自1987年开始筹建,1990年正式成立。在这些工作的基础上,相关研究得以开展。当时首先建立了两个理(lǐ)论。一是问题求解的商(shāng)空间理(lǐ)论和粒计算理(lǐ)论,在國(guó)际上影响很(hěn)大。2005年,清华大學(xué)发起、组织了國(guó)际粒计算会议,每年一次,延续至今。二是在人工神经网络方面做了很(hěn)多(duō)早期工作。

人工智能(néng)的三个阶段

1956年至今,人工智能(néng)的发展分(fēn)為(wèi)三个阶段,分(fēn)别是第一代人工智能(néng)、第二代人工智能(néng)和第三代人工智能(néng)。

第一代人工智能(néng)的目标是让机器像人类一样思考。思考是指推理(lǐ)、决策、诊断、设计、规划、创作、學(xué)习等。无论做管理(lǐ)工作还是技术工作,都需要两方面的能(néng)力,一是在某个领域具有(yǒu)丰富的知识和经验,二是具有(yǒu)很(hěn)强的推理(lǐ)能(néng)力。其中推理(lǐ)是指运用(yòng)知识的能(néng)力,换言之,是从已有(yǒu)知识出发,推出新(xīn)的结论、新(xīn)的知识的能(néng)力。基于以上分(fēn)析,人工智能(néng)的创始人提出了“基于知识与经验的推理(lǐ)模型”,该模型的核心是若要实现机器思考,只需将相应的知识放入计算机即可(kě)。例如,如果要让计算机像医生一样為(wèi)患者诊断,只需要把医生的知识和经验放到知识库里,将医生看病的推理(lǐ)过程放入推理(lǐ)机制之中,计算机就能(néng)為(wèi)患者实施机器诊断。这一推理(lǐ)模型的核心思想是知识驱动,通过计算模型来实现让机器像人类那样思考。该模型最大的缺点是缺乏自學(xué)能(néng)力,难以从客观世界學(xué)习知识,所有(yǒu)知识都源于人类灌输。因此,第一代人工智能(néng)永遠(yuǎn)无法超越人类。

第二代人工智能(néng)源于第一代人工智能(néng)的低潮期,主要基于人工神经网络。1943年,人工神经网络模型提出,它主要模拟人类脑神经网络的工作原理(lǐ)。第二代人工智能(néng)面临的主要问题是感性知识的传授。第一代人工智能(néng)主要在符号主义指导下进行,目的是模拟人类的理(lǐ)性行為(wèi)。但人类除了理(lǐ)性行為(wèi)外,还有(yǒu)大量的感性行為(wèi),而感性行為(wèi)要用(yòng)人工神经网络进行模拟。我们常说知识是人类智慧的源泉,知识是理(lǐ)性行為(wèi)的基础,这里的知识来自教育,主要指理(lǐ)性知识、分(fēn)析问题的方法等。但感性的知识难以用(yòng)语言传授,也无法从书本上获得。每一个人最初得到的感性知识是对自己母亲的认识。但,具體(tǐ)是什么时候开始对母亲有(yǒu)所认识的?又(yòu)是怎样实现这种认识的?这些问题到现在仍难以解答(dá)。所有(yǒu)感性知识都在不断观察、不断倾听的过程中學(xué)习累积,第二代人工智能(néng)深度學(xué)习沿用(yòng)了这个方法。例如,过去我们主要通过编程的方法告诉计算机马、牛、羊的具體(tǐ)特征,现在则将网上大量马、牛、羊的照片做成训练样本,让计算机进行观察和學(xué)习即可(kě)。學(xué)习完毕,再把剩下的样本作為(wèi)测试样本去测试它,识别率能(néng)达到95%以上。观察和倾听的过程通过人工神经网络进行,将识别的问题作為(wèi)分(fēn)类问题,利用(yòng)人工神经网络来分(fēn)类。通过神经网络进行學(xué)习的过程称為(wèi)深度學(xué)习,基于深度學(xué)习能(néng)够进行分(fēn)类、预测和生成等。但是第二代人工智能(néng)的所有(yǒu)数据(图像、语音等)均来自客观世界,它的识别只能(néng)用(yòng)于區(qū)别不同的物(wù)體(tǐ),并不能(néng)真正地认识物(wù)體(tǐ)。所以第二代人工智能(néng)最大的问题是不安全、不可(kě)信、不可(kě)控、不可(kě)靠、不易推广。

第三代人工智能(néng)的基本思路是必须发展人工智能(néng)理(lǐ)论。迄今為(wèi)止,人工智能(néng)尚无较為(wèi)成型的理(lǐ)论,更多(duō)是模型和算法,且第一代和第二代人工智能(néng)的模型、算法都有(yǒu)很(hěn)多(duō)缺陷。因此,必须大力发展科(kē)學(xué)完备的人工智能(néng)理(lǐ)论,在此基础上,才能(néng)发展出安全、可(kě)控、可(kě)信、可(kě)靠和可(kě)扩展的人工智能(néng)技术。对目前的人工智能(néng)技术而言,虽然提高了效率和质量,但系统越信息化和智能(néng)化,也就意味着越不安全。第一代人工智能(néng)运用(yòng)了知识、算法、算力三个要素,其中最主要的是知识。第二代人工智能(néng)则主要用(yòng)了数据、算法和算力三个要素。為(wèi)了克服人工智能(néng)的固有(yǒu)缺点,唯一的办法是把知识、数据、算法和算力这四个要素同时运用(yòng)。目前得到较多(duō)运用(yòng)的AI工具(大语言模型),就能(néng)够充分(fēn)利用(yòng)知识、数据、算法、算力这四个要素。清华大學(xué)团队提出了第三代人工智能(néng)的三空间模型,将整个感知、认知系统进行连接,為(wèi)发展人工智能(néng)理(lǐ)论提供了非常好的条件。

深度學(xué)习的不安全性

在研究过程中,研究者发现了人工智能(néng)深度學(xué)习的不安全性。

其中一个典型案例是:研究者制作了雪(xuě)山(shān)和狗的对比图,先让计算机和人看雪(xuě)山(shān),二者都能(néng)判定為(wèi)雪(xuě)山(shān),但是只要在图片上添加一点噪声,人看雪(xuě)山(shān)仍是雪(xuě)山(shān),计算机却会将雪(xuě)山(shān)看成一条狗。这个案例说明,人工智能(néng)目前基于深度學(xué)习的模式识别跟人类的视觉完全不同,尽管它能(néng)够像人类那样區(qū)分(fēn)雪(xuě)山(shān)和狗,但实际上它既不认识狗,也不认识雪(xuě)山(shān)。这里面的关键问题是——什么是狗?应该如何定义一条狗?人类通常通过视觉来进行區(qū)分(fēn),主要看狗的外形,但什么是狗的外形?狗有(yǒu)各种形态、各种姿势,為(wèi)什么人类的视觉能(néng)够在千变万化的外形里确定目标是狗?这个问题的答(dá)案,到现在為(wèi)止尚未弄清楚。最早的计算机识别狗时,狗变换了位置后计算机就不能(néng)识别了,这是位移的不变性,这个问题现在已经解决。但是尚未解决的问题还有(yǒu)很(hěn)多(duō)。例如,计算机能(néng)够识别固定尺寸的狗,但是把狗变大或变小(xiǎo)后都难以识别,这是大小(xiǎo)的不变性。现在计算机只能(néng)通过局部纹理(lǐ)来區(qū)分(fēn)狗和雪(xuě)山(shān)。因此,如果将雪(xuě)山(shān)图上的某个纹理(lǐ)改成皮毛纹理(lǐ),即便雪(xuě)山(shān)的形状保持不变,计算机仍会把雪(xuě)山(shān)误认為(wèi)是狗。所以说,到目前為(wèi)止,人工智能(néng)的深度學(xué)习仍然不够安全可(kě)靠。

大语言模型的“大模型”与“大文(wén)本”

目前比较成功的AI工具,其强大性主要来源于两个“大”,一是大模型,二是大文(wén)本。

第一个大模型的“大”是大的人工神经网络,人工神经网络可(kě)以用(yòng)来分(fēn)类、學(xué)习数据中间的关联关系,也可(kě)以用(yòng)来预测。这个巨大的人工神经网络叫“转换器”。AI工具的能(néng)力强大,离不开深度神经网络的强大。原来的神经网络是逐字输入,现在一次能(néng)够输入2000多(duō)字(一个token,粗略地讲相当于一个汉字)。人类从1957年到2013年花(huā)了56年时间探究文(wén)本的语意表示问题,现在的文(wén)本不是用(yòng)符号表示,而是用(yòng)语意向量表示,这也是最重要的一个突破。过去计算机处理(lǐ)文(wén)本只能(néng)把它当作数据处理(lǐ),现在可(kě)以把它当成知识来处理(lǐ),即向量表示。此外,还提出了“自监督學(xué)习”。过去供计算机學(xué)习的文(wén)本都要做预处理(lǐ)、预先标注,此项工作量太大,所以无法支撑计算机大量學(xué)习。自监督學(xué)习是指原来的文(wén)本不经过任何处理(lǐ)就可(kě)以被计算机學(xué)习,用(yòng)前面的文(wén)本预测后面的词,输入后预测下一个,被预测的内容又(yòu)把再下一个变成输入,有(yǒu)些类似于接龙式學(xué)习方式。

第二个“大”是大文(wén)本。计算机实现自监督學(xué)习后,所有(yǒu)文(wén)本不用(yòng)经过任何预处理(lǐ)就可(kě)以學(xué)习,文(wén)本也由原来的GB量级发展為(wèi)TB量级。现在比较成功的人工智能(néng)大约學(xué)习了40TB以上,相当于一千多(duō)万本牛津辞典,并且这个學(xué)习过程并非死读,而是理(lǐ)解其中的内容。这就使得我们进入了生成式人工智能(néng)时代。无论是第一代还是第二代人工智能(néng),都受到三个限制——特定领域用(yòng)特定模型完成特定任務(wù)。“三个特定”是所谓的“窄人工智能(néng)”,即专用(yòng)人工智能(néng)。目前比较成功的AI工具能(néng)够通过其强大的语言生成能(néng)力让人类在与它对话时没有(yǒu)领域限制,这是人工智能(néng)的重大进步。另外,生成多(duō)样性的输出是目前AI工具的重要特征。它有(yǒu)多(duō)样化的输出就有(yǒu)可(kě)能(néng)创新(xīn),因為(wèi)输出多(duō)样化,难以保证每个输出都正确,所以越希望它能(néng)输出有(yǒu)创造性,就越要允许它犯错误。我们在日常使用(yòng)一些AI工具时也会发现,有(yǒu)时AI对问题的回答(dá)非常机智聪明,有(yǒu)时则是明显的胡说八道,这就是多(duō)样化输出的结果。

目前AI工具产生了两个重大突破,一是生成语意连贯的类似人类的文(wén)本,二是在开领域实现了人机自然语言对话。大语言模型是向通用(yòng)人工智能(néng)迈出的一步,有(yǒu)西方专家认為(wèi)这是通用(yòng)人工智能(néng)的曙光,但它并不是通用(yòng)人工智能(néng),人类走向通用(yòng)人工智能(néng)依然任重道遠(yuǎn)。

走向通用(yòng)人工智能(néng)必须满足三个条件。第一,系统必须与领域无关。目前较為(wèi)成功的AI工具在对话、自然语言处理(lǐ)的问题上做到了与领域无关,但在处理(lǐ)其他(tā)大量问题上仍难以实现这一目标。第二,系统与任務(wù)无关,即什么任務(wù)都会做。目前AI工具能(néng)进行对话、四则运算、作诗、写代码等多(duō)种任務(wù),但仍难以完成复杂环境下的复杂任務(wù)。第三,尚需建立一个统一的理(lǐ)论。因此,人工智能(néng)还有(yǒu)很(hěn)長(cháng)的路要走。

大语言模型迈向通用(yòng)人工智能(néng)的四个步骤

从大语言模型迈向通用(yòng)人工智能(néng)需要四个步骤。第一步是跟人类进行交互、与人类对齐,第二步是多(duō)模态生成,第三步是与数字世界交互,第四步是与客观世界交互。我们并不是说,完成这四步就意味着实现了通用(yòng)人工智能(néng),而是说通往通用(yòng)人工智能(néng)这个目标,至少需要迈出以上四步。

第一步是与人类对齐。目前AI工具输出的内容不一定正确,若要解决这个问题,必须依靠人类帮助它克服,使之与人类对齐。从AI工具的应用(yòng)实践来看,它的错误需要人类帮助纠正,而且它的错误纠正速度和迭代速度都很(hěn)快。与此同时,我们要看到输出内容的错误仍然存在,但我们如果想要它具有(yǒu)创造性,就要允许它犯错误。

第二步是多(duō)模态生成。现在已经可(kě)以用(yòng)大模型生成图像、声音、视频、代码等各种模态的内容。随着技术的进步,鉴别一个内容是由机器生成还是人工完成将会变得越来越困难,这為(wèi)“造假”提供了非常好的机会。“造假”又(yòu)名“深度造假”,即用(yòng)深度學(xué)习的办法“造假”。试想一下,如果以后网络上95%的文(wén)本都由AI生成,那么我们还能(néng)通过网络获取真知与真相吗?比方说,当一件事情发生后,网络上出现一片支持或者反对意见,这些意见究竟是来自多(duō)数人的真实表达,还是来自少数人操纵AI歪曲事实?如何有(yǒu)效防止AI工具操纵舆论、混淆视听,这是需要我们严肃考虑的。

目前人工智能(néng)领域已经实现了三项突破,即开领域生成语意连贯的类似人类的文(wén)本。其中,语意连贯是最重要的突破,这个突破后就有(yǒu)了图像的突破。因為(wèi)图像只要求在空间上连贯即可(kě),而视频则进一步要求时空上的连贯。我们在语言上进行突破,紧接着会有(yǒu)图像的突破,图像突破后肯定还会有(yǒu)视频的突破。在这个发展过程中,计算的资源要求和硬件都会变得越来越多(duō)。

随着人工智能(néng)的发展,很(hěn)多(duō)人注意到了“涌现”现象。例如,当系统规模没有(yǒu)达到一定程度时,生成的图画很(hěn)糟糕、水平较差,但当规模达到一定程度,生成的大多(duō)数图画突然间就变得质量很(hěn)高。这个过程称為(wèi)“涌现”,“涌现”是从量变到质变的过程。到目前為(wèi)止,全世界范围内都还无法完全理(lǐ)解“涌现”现象出现的原因。

第三步是AI智能(néng)體(tǐ)。大语言模型迈向通用(yòng)人工智能(néng)必须与数字世界进行连接,首先在数字世界里具體(tǐ)操作,从而解决问题、感知自己成果的优劣,并进行反馈。这个工作对促进大模型的性能(néng)向前发展有(yǒu)很(hěn)大益处。

第四步是具身智能(néng)。具身智能(néng),即具有(yǒu)身體(tǐ)的智能(néng)。智能(néng)光有(yǒu)脑还不够,还必须具有(yǒu)身體(tǐ),这样才能(néng)动口又(yòu)动手。所以,大语言模型迈向通用(yòng)人工智能(néng),必须通过机器人与客观世界连在一起。

人工智能(néng)的产业发展

当下,信息产业的发展非常迅猛,原因在于建立了相关理(lǐ)论,在理(lǐ)论指导下制作的硬件和软件都是通用(yòng)的。过去,信息产业领域内出现了一些具有(yǒu)世界影响力的大型企业,应用(yòng)推广相应技术并实现信息化,整个链条发展非常迅速。但是,人工智能(néng)产业的发展缺乏理(lǐ)论,只有(yǒu)算法和模型,而根据算法和模型建立的硬件和软件全是专用(yòng)的。“专用(yòng)”即意味着市场很(hěn)小(xiǎo),到现在為(wèi)止,人工智能(néng)产业还没有(yǒu)产生具有(yǒu)世界影响力的大型企业,所以人工智能(néng)产业必须跟垂直领域深度结合才有(yǒu)可(kě)能(néng)发展。不过,目前情况也在发生变化,具有(yǒu)一定通用(yòng)性的基础模型的出现,肯定会影响产业发展。

2020年,全世界人工智能(néng)产业达到10亿美元以上的独角兽企业一共有(yǒu)40家,2022年变成117家,2024年初达到126家,从这个情况来看,它是逐步增長(cháng)的。到现在為(wèi)止,中國(guó)有(yǒu)100甚至200家企业在做大模型。这么多(duō)人做基础模型,他(tā)们未来的出路在哪里?

第一个出路是向各行各业转移,做各个垂直领域的大模型。现在很(hěn)多(duō)行业都在考虑这个问题,例如石油行业考虑石油行业的大模型,金融行业考虑金融行业的大模型,所以将来做通用(yòng)大模型的数量将越来越少,大多(duō)数做大模型的人才会转向各个垂直领域。第二个出路是最重要的,即经过微调应用(yòng)在产业里。换言之,提供公开的大模型软件,让大家开发应用(yòng)。第三个出路是跟其他(tā)技术结合,发展新(xīn)的产业。國(guó)外很(hěn)多(duō)独角兽企业都将AI工具与其他(tā)技术结合,发展新(xīn)产业,有(yǒu)的是向各个行业转移,还有(yǒu)的专门做图像、视频、语音等。國(guó)内一些大模型现在也已经取得了比较好的发展。

基于此,势必要推动人工智能(néng)领域的产业变革。今后无论做硬件还是做软件,一定要放到基础模型的平台当中。过去是在一个零基础的计算机中制作软件,效率很(hěn)低,而现在平台已经學(xué)习超过一千万本牛津辞典,能(néng)力水平至少相当于一个高中生,若将同样的工作放到基础模型的平台上进行将会事半功倍,所以采用(yòng)这个平台是不可(kě)阻挡的趋势。而这些“高中生”则来源于大模型企业提供的公开平台。

大模型的局限性

大模型的所有(yǒu)工作都由外部驱动,在外部提示下进行。它缺乏主动性,在外部提示下做某事时,主要基于概率预测的方法,所以会出现一些人类没有(yǒu)的缺点,即输出的质量不可(kě)控。并且它不知道是非对错,所以它的输出也不可(kě)信。与此同时,它受外部影响太大,只能(néng)听从指令来完成相应的事情。但人类则是完全不同的,即使这件事是由别人安排完成,人也能(néng)够在自己的意识控制下进行,所以是可(kě)控、可(kě)信的。

由此可(kě)见,目前的人工智能(néng)并不知道自己的所作所為(wèi)。AI工具尚不能(néng)准确分(fēn)辨对错,且现在还难以主动进行自我迭代,仍旧需要在人类的操作下进行。未来的人工智能(néng)最多(duō)成為(wèi)人类的助手,在人类的监控下进行操作,只有(yǒu)少数工作可(kě)以完全交给机器独立完成。有(yǒu)研究机构曾做过关于人工智能(néng)对各行各业影响的统计,列出了大量行业,在未来这些行业中只有(yǒu)少数工作可(kě)能(néng)会被人工智能(néng)取代。可(kě)见,人工智能(néng)对各行各业都有(yǒu)重大影响,但大多(duō)数是帮助人类提高工作质量和效率,而非取代人类进行工作。

人工智能(néng)是探索“无人區(qū)”,其魅力就在于它永遠(yuǎn)在路上。我们不能(néng)因為(wèi)它的进展而过于乐观,也不必因為(wèi)它的挫折而沮丧,我们需要的是坚持不懈地努力。(本讲座文(wén)稿由清华大學(xué)新(xīn)闻与传播學(xué)院博士生牛雪(xuě)莹整理(lǐ))


原标题 探索之路:人工智能(néng)发展的回顾与展望

演讲人:张钹  演讲地点:清华大學(xué)“人文(wén)清华讲坛” 演讲时间:2024年4月

张钹 中國(guó)科(kē)學(xué)院院士,清华大學(xué)计算机系教授,清华大學(xué)人工智能(néng)研究院名誉院長(cháng)。2011年德國(guó)汉堡大學(xué)授予自然科(kē)學(xué)名誉博士,获2014年度CCF(中國(guó)计算机學(xué)会)终身成就奖,2019年度吴文(wén)俊人工智能(néng)科(kē)學(xué)技术奖最高成就奖。主要从事人工智能(néng)、人工神经网络和机器學(xué)习等理(lǐ)论研究,以及模式识别、知识工程和机器人等应用(yòng)技术研究。在上述领域发表學(xué)术论文(wén)200多(duō)篇、专著5部(章)。科(kē)研成果获ICL欧洲人工智能(néng)奖等奖项。

《光明日报》(2024年05月25日 10版)



地方动态

中國(guó)信息协会会長(cháng)王金平参加第七届数字中國(guó)建设峰会

全國(guó)大學(xué)生创新(xīn)发明大赛暨“英创工程”启动

赋能(néng)未来,共创数智化新(xīn)纪元:中國(guó)信息协会集团企业数字化工作委员会正式成立

中國(guó)信息协会第四届信息技术服務(wù)业应用(yòng)技能(néng)大赛新(xīn)闻发布会在京召开

  • 协会要闻
  • 通知公告