Siri 的共同创立者 Cheyer 说,在做 Siri 的时候经历了一些有(yǒu)趣的事:当把 Start Over 输入的时候,系统却开始寻找路易安娜的 Over 公司。那一刻他(tā)顿时理(lǐ)解了真实数据的重要性。
美國(guó)新(xīn)墨西哥(gē)大學(xué)计算机系的助理(lǐ)教授 David Ackley 的经历也非常有(yǒu)趣。当他(tā)开始研究人工智能(néng)的时候,把对 AI 的追求视為(wèi)一种理(lǐ)解自己、人们和世界的方式。但最终却发现自己的追求转向了人工生命——听起来似乎很(hěn)相似,但是AI和人工生命有(yǒu)不同的目标、技术和研究团體(tǐ)。
Vicarious的共同创立者 George 提到了一个有(yǒu)趣的项目,一个能(néng)源公司打算建造风力发電(diàn)厂,找来了 George 要建立视频分(fēn)析,通过监视录像中向不同迁徙的山(shān)羊脚印,来计算山(shān)羊总数。
人工智能(néng)属于新(xīn)兴科(kē)技,很(hěn)多(duō)人并没有(yǒu)感同身受的體(tǐ)验。站在专家们的肩膀上,通过他(tā)们有(yǒu)趣而又(yòu)充满干货的分(fēn)享,我们来看看人工智能(néng)最火爆的几个问题,究竟是怎么回事。
我们把六个问题摘录如下:
1.在AI研究中最令您感到恍然大悟的事情是什么?
2.AI天生似乎有(yǒu)一种倾向来时不时地给人启迪和惊喜的能(néng)力。你曾有(yǒu)过这样的经历吗?如果有(yǒu),你能(néng)描述一下吗?
3.目前為(wèi)止,你所见过 AI 不同寻常的使用(yòng)方式是什么?
4.你见到过在谈论AI中最大的秘密是什么?
5.你认為(wèi)对AI的恐惧在未来如何变化或转变?
6.你认為(wèi)AI研究的下个中心是什么?
在本文(wén)的第一部分(fēn)中,我们会涉及到一些AI研究的令人恍然大悟的问题,围绕这个技术中的惊喜和发现,也有(yǒu)一些最不同寻常的情况。
在AI研究中最令您感到恍然大悟的事情是什么?
Cheyer:在AI方面我有(yǒu)过的最令我恍然大悟的事情是我还在Siri公司工作的时候的事了(在苹果要求公司开发他(tā)们的语音助手之前)。在那时候,我们有(yǒu)Siri的原型,当时它被作為(wèi)學(xué)术研究来开发了几年。Siri有(yǒu)一些很(hěn)有(yǒu)趣的技术上的创意并且在完成很(hěn)多(duō)任務(wù)时它看起来运作的很(hěn)好。我们接着收到了第一个储存着2千万公司名字的数据,我们把它作為(wèi)词汇加载到我们的系统中。我输入了最基础的自然语言命令,“重新(xīn)开始(start over)”(这本来会将系统重置到一个无语境的状态),然而系统回应说,“在路易安娜的非建制地區(qū)(Start)内,寻找公司‘Over’!”那时候,我意识到英语语言中的每一个单词都是一个公司名称或者是一个地理(lǐ)位置,这种可(kě)能(néng)产生的,有(yǒu)爆炸性的歧义组合比我所预期的要多(duō)得多(duō),并且學(xué)术原型与使用(yòng)数据并根据用(yòng)户提供的要求来真正解决问题,这两者之间有(yǒu)着很(hěn)大的不同。在我的生涯中,基于这些限制条件让系统重新(xīn)变得非常精确是我做过的最有(yǒu)趣和最重要的项目了。真实数据的重要性有(yǒu)点像对一个很(hěn)明显道理(lǐ)的顿悟,但是现在回头看,这是一个我不得不亲身经历才能(néng)懂得并领悟其重要性的教训。
Ackley:我似乎只能(néng)在事后才能(néng)意识到一些重大见解。例如我把对AI的追求视為(wèi)一种理(lǐ)解自己、人们和世界的方式,但是最后发现自己转向了人工生命——听起来似乎很(hěn)相似,但是AI和人工生命有(yǒu)不同的目标、技术和研究团體(tǐ)。回想过去,智能(néng)虽然非常重要,但是也会倾向于高估它自己,这个规律变得很(hěn)明显。為(wèi)了明白某人在任一天任何一分(fēn)钟内将要在世界上做什么,有(yǒu)一个事实是有(yǒu)很(hěn)大影响力的,那就是他(tā)们是一个活着的生物(wù),而且必须以某种方法去做一个生物(wù)要做的事情,而不特别限于一个智能(néng)的生物(wù)。(现在人工生命和AI均涉及了很(hěn)多(duō)電(diàn)脑编程,此外令我恍然大悟的程度较小(xiǎo)的事情很(hěn)明确,通常是天才设计的问题被解决了,或者,仍是发生很(hěn)多(duō)次的事情,就是bugs突然解决了)。
George:很(hěn)难挑出一个这样的事情来,所以我挑出一些杰出的神经科(kē)學(xué)的研究,这些研究我认為(wèi)能(néng)够引导智能(néng)系统的发展:Hubel 和Wiesel ,Mountcastle ,Rudiger vonder Heydt , Tai Sing Lee , Joaquin Fuster ,和 Jim Dicarlo 都是一些在大脑皮层回路计算原理(lǐ)上做出贡献的科(kē)學(xué)家的典范。像 George Lakoff 和 Mark Johnson 这样的认知科(kē)學(xué)家在高层次概念是如何从具身经验中创造出来这一方面得出合理(lǐ)的理(lǐ)论。将所有(yǒu)这些知识放入到被 Judea Pearl , Geoff Hinton 研究得出的计算框架中,还有(yǒu)其他(tā)的事情,都是十分(fēn)令人兴奋的。
AI天生似乎有(yǒu)一种倾向来时不时地给人启迪和惊喜的能(néng)力。你曾有(yǒu)过这样的经历吗?如果有(yǒu),你能(néng)描述一下吗?
Cheyer:我有(yǒu)过很(hěn)多(duō)自己研究的AI系统给我一种启迪式惊喜的经历;这是我从事AI研究众多(duō)的原因之一。这里说一个记忆犹新(xīn)的故事,当我从事一个叫做 CALO 的项目时(CALO:Cognitive Assistant that Learns and Organizes,能(néng)够學(xué)习和组织的认知性助手)。这个项目是美國(guó)历史中政府资助最多(duō)的AI和机器學(xué)习项目之一。CALO的目标是构造一个智能(néng)自动化助手,它通过帮助管理(lǐ)信息工作者的任務(wù)、日历、文(wén)件、项目、交流等等,让信息工作者(如你和我这样的人)提高工作效率。我曾运行这个系统的一个版本,然后随着我用(yòng)邮件、文(wén)件等等工作时,CALO根据我的所有(yǒu)信息,自动制作了一个“语义地图”,将各个项目中的员工连接起来,决定他(tā)们工作中的角色和他(tā)们应该完成的任務(wù)等等。由于CALO项目是我从事过的主要项目之一,它和其他(tā)的子项目和任務(wù)一起放在我的项目清单中。一天我和系统用(yòng)自然语言互动,然后我用(yòng)了CALO这个词作為(wèi)一个项目的名字。CALO回应的方式与CALO被用(yòng)作人名回应的方式一致(我多(duō)希望我记得那时的问题和回答(dá))。然后我很(hěn)惊讶。我记得当时在想,“CALO觉醒了并将自己当做是人了?”后来我弄清楚了这次出乎意料表现的原因。结果是CALO并没有(yǒu)那么觉醒,但是就在那时候,我感觉十分(fēn)惊喜与兴奋。
Ackley:在一个 Michael Littman 和我从事过的早期工作中,一个惊喜发生了。工作关于利他(tā)主义的进化——对于所谓的“自私”进化来说很(hěn)棘手的问题。我们编程让可(kě)进化的生物(wù)有(yǒu)了神经网络“大脑”,并模拟了一个环境,在这个环境中个體(tǐ)只有(yǒu)在接受很(hěn)严重的风险时才会受益。我们的处理(lǐ)是我们测试了成组的生物(wù),并给它们一些可(kě)进化的能(néng)力——发出起初没有(yǒu)任何意义的声音的能(néng)力和能(néng)够听到组内声音的能(néng)力。我们发现非交流个體(tǐ)总是首先出现。然而,在一些进化条件下,我们观察到后代生物(wù)们通过互相发送信号提示环境中的机会和危险而获得的分(fēn)数比任何孤独的生物(wù)都高——即使这种“事实性的声音”没有(yǒu)给发音者直接的回报。进化是关于竞争,也关于合作;环境和细节也很(hěn)重要。接下来的事情如果不够令人兴奋的话,至少令人惊讶的是起初在某些实验中,在合作性交流者出现后,一些低分(fēn)的个體(tǐ)也存活下来并扩散。我们发现它们作為(wèi)个體(tǐ)表现的更好了,而且它们也完全聋了,并且它们经常喊着一些无意义的声音来混淆那些不聋的生物(wù)。如此这般!
George:我们在Vicarious 构造的系统的一个特点就是它们能(néng)够想象不同的情形和相应概率的能(néng)力。想象力可(kě)以被用(yòng)在无法预测的形式中,并且我们可(kě)以产生一些奇怪的组合例如半狗半車(chē)的形状。它的另一种呈现形式是幻想一些不在那里的东西,例如当我们看到云的形状时。
目前為(wèi)止,你所见过 AI 不同寻常的使用(yòng)方式是什么?
Cheyer: AI 被用(yòng)于各种各样、可(kě)见到、很(hěn)实用(yòng)的任務(wù)中,但是我特别喜欢AI用(yòng)于富有(yǒu)创造性或者艺术领域,这对于我来说,能(néng)够让我理(lǐ)解什么让人為(wèi)“人”。我最喜欢的一些例子包括:
David Cope 在EMI (音乐智能(néng)实验)上的工作,它主要是关于電(diàn)脑程序创造了很(hěn)多(duō)不同形式的优美的音乐作品,从经典到爵士再到纳瓦霍式音乐。
Kim Binsted’s JAPE(“Joke Analysis andProduction Engine”),一个電(diàn)脑程序,能(néng)够创造一些双关语和其他(tā)的幽默(例如 “What do you call a Martian who drinksbeer? An ale-ien!”)
像Automated Insights 和 Narrative Science 这样的故事生成公司,能(néng)够写一些总结某些事件或情况的散文(wén)。例如“27个Colonials队员来到棒球场上,这个Virginia投手战胜了他(tā)们,投了一场漂亮的比赛。在这场由他(tā)掌控的令人难忘的比赛中,他(tā)击败了10个击球手。”
Harold Cohen’s AARON ,一个机器人创造艺术作品,不是使用(yòng)像素而是真正的画画。它创作了这个作品,它选择颜色,混合他(tā)们然后真真正正的画画,从开始到最后,没有(yǒu)任何图片和其他(tā)输入作為(wèi)指导。下图是AARON 在1992年的作品。其他(tā)人也试着扩展 Harold Cohen 的感知型作品范围,例如Benjamin Grosser 的交互式机器人画画机器和 Oliver Deussen和Thomas Lindemeier 的e-DavidRobot画画机器人。
Ackley:我对最新(xīn)的应用(yòng)还不是很(hěn)清楚,虽然近期谷歌工程师从人工神经网络生成的梦境图片很(hěn)引人注目。
这个问题假定了AI的使用(yòng)的普遍性,而且我认為(wèi)这本身就很(hěn)值得注意。社会中的技术发展依序应这样变化——新(xīn)技术出现,熟悉,期望,无聊并最终谈出人们的视線(xiàn)而且许多(duō) AI 创新(xīn)正在这样发展,从众多(duō)语音中的语音识别到車(chē)牌号和邮政编码的图片识别到开車(chē)和煮饭的模糊逻辑。
George:许多(duō)年前,一家大的能(néng)源公司想要与我们合作一个视频分(fēn)析项目。公司打算建造一个风力发電(diàn)厂,他(tā)们需要一个通过监视录像中向不同方向迁徙的山(shān)羊的脚印来计数山(shān)羊总数。
你见到过在谈论AI中最大的秘密是什么?
Cheyer:我并不认為(wèi)关于AI有(yǒu)任何真正意义上的秘密——如果非要说的话,我认為(wèi)秘密就在未来的众多(duō)可(kě)能(néng)性中。然而(这是一个很(hěn)大的转折),我认為(wèi)人们经常过低的估计创造一个类人智能(néng)的难度,并且过高的估计我们完成AI的进度。如今有(yǒu)一些很(hěn)有(yǒu)信誉的科(kē)學(xué)家如 Elon Musk 和霍金提出了一种可(kě)能(néng)性,就是真正的AI和AI觉醒不久就要发生了,这很(hěn)有(yǒu)压力。Ray Kurzweil公开宣称在将来的30年内,“1000美金能(néng)够买到一台比所有(yǒu)人合起来的智力高出十亿倍的電(diàn)脑。”Ray的假说主要依据硬件,例如将人脑能(néng)做的计算总量与電(diàn)脑的处理(lǐ)速度相比。我会為(wèi)此辩论,软件(例如给電(diàn)脑的命令)比处理(lǐ)速度(处理(lǐ)这些命令的速度)要重要的多(duō),并且即使是在计算机和神经科(kē)學(xué)领域最顶尖的科(kē)學(xué)家对人类智能(néng)也只是一知半解。我对我们能(néng)够完成人类级别的智能(néng)时间的预测是在百年或千年级别而不是几年或者几十年。
George:我时不时会见到两种极端看法。第一种是通用(yòng)智能(néng)永遠(yuǎn)不会实现(因為(wèi)大脑太复杂以至于无法理(lǐ)解),或者是它“明天”就会发生并且失去控制。另外,一些新(xīn)的报道倾向于对AI会如何变化有(yǒu)很(hěn)多(duō)错误理(lǐ)解。许多(duō)情况下,标题会夸大实际被完成的工作,或者说夸大一次发现的影响,因為(wèi)浮夸的报道会带来更多(duō)的点击率。
你认為(wèi)对AI的恐惧在未来如何变化或转变?
Cheyer:我在AI领域工作的时间很(hěn)久,经历过几轮“对AI情绪的正弦性变化”。20世纪80年代,专家系统(用(yòng)人工智能(néng)技术编成的软件,能(néng)够使用(yòng)专家的知识数据库给出建议和决策,例如在医學(xué)诊断和股票中)非常热门,并且人们打算到处制造智能(néng)机器。但是后来当事实没有(yǒu)达到公众期望时,在20世纪90年代和21世纪初期,AI过时了。自从21世纪中期,AI蓄势重返并且有(yǒu)很(hěn)有(yǒu)力的原因!在一些如图片处理(lǐ)、语音识别、虚拟助手、自动驾驶、机器學(xué)习等等领域中,有(yǒu)了实质性的进步。这些新(xīn)的成功汇聚在一起,使外界对接下来会发生的事情产生了期望(和恐惧)。然而,我猜当尘埃落定后,这种关于AI的(恐惧)和期望会大概消失十年左右…回想20世纪50年代和60年代(AI很(hěn)火),70年代(不火),到了今天,我认為(wèi)我们看到了连续不断的、实质性进步,而在这期间公众的关注会随时间上下起伏。
Ackley:AI发展会有(yǒu)一个快速的、无法理(lǐ)解的“科(kē)技奇点”出现,这种想法是一个谜,这种想法在某些程度上看是有(yǒu)道理(lǐ)的但是最终它只是一个智能(néng)高估它本身的例子。实际世界中,变化多(duō)样发展速度是受到限制的,这种限制来源于从时间和距离到质量和能(néng)量再到法律、金钱、政治、情感等等方面。“智能(néng)”喜欢将自身看做是在操作轻舟,但实际上是操作一个很(hěn)大的船,并且有(yǒu)四面八方的压力;而且事实上,“智能(néng)”不像是船長(cháng),而更像是研究船的史學(xué)工作者。就算接下来,我们真的创造出这样的机器,我们应该更多(duō)地关心如何正确的抚育他(tā)们,而不是与它们竞争。接下来要说的事情,它也是事实,那就是,至少不久的将来,AI技术将会继续发展而且加速经济和劳动力的错位,这也是成功的技术会引发的结果,并且作為(wèi)一个社会,我们大部分(fēn)没有(yǒu)处理(lǐ)过那样的事情。相似地,自动化武器问题看起来很(hěn)紧迫和危险,虽然这种危险更多(duō)依附于武器(一个能(néng)够产生巨大破坏力的、被简单开关控制的机器)上,而不是依附于控制着那个开关的鼓吹战争的人、恐怖主义者、疯子或者不完美的机器上。
George:自从火的发明后,新(xīn)科(kē)技总是有(yǒu)可(kě)能(néng)用(yòng)于帮助或伤害他(tā)人。建造一些新(xīn)事物(wù)的部分(fēn)责任是保证你创造的事物(wù)对于人类来说是净正的(正面作用(yòng)和负面作用(yòng)抵消后)。我认為(wèi)现在,人们对于AI有(yǒu)更多(duō)的恐惧是因為(wèi)人们对它知之甚少。我觉得AI研究团體(tǐ)的能(néng)力与好莱坞或者媒體(tǐ)是很(hěn)不连通的。我认為(wèi)一旦人们了解了这些系统是如何运作,并且知道了它们的限制,人们会感到安心一些。
你认為(wèi)AI研究的下个中心是什么?
Cheyer:现在,由于深度學(xué)习最近在图片识别和语音识别中的成功,深度學(xué)习(例如深度神经网络)恐怕是AI领域最火的话题。在我看来,深度學(xué)习主要与我认為(wèi)是“感知”功能(néng)相关联,例如识别文(wén)字、脸和物(wù)體(tǐ)。我期望随着机器开始掌握这些低层次的功能(néng),更多(duō)的注意力会不久转向高层次的功能(néng)例如计划能(néng)力和推理(lǐ)能(néng)力,这是人类能(néng)力的核心。在Viv实验室,我们正致力于一项这样的技术,它能(néng)够使電(diàn)脑通过學(xué)习加强式的自动程序合成技术来解决一些复杂的任務(wù),这能(néng)够促使一系列之前受人编程限制的用(yòng)例的实现。
Ackley:AI的研究会有(yǒu)许多(duō)名字,而且不同的情况下看起来也不同,而且将来研究进度会有(yǒu)停滞期,但是下个十年来看,还是“机器學(xué)习所有(yǒu)的事情”:将大的人工神经网络和相似的技术应用(yòng)到所有(yǒu)可(kě)以想到的,能(néng)够获取到足够数据的任務(wù)中。机器學(xué)习的硬件也将会强大而廉价,促使相应研究和发展的范围的扩大。起初,这样应用(yòng)产生的结果会从巨大的数据中心出现并渗透到互联网中,在互联网中没有(yǒu)人知道它是机器人,然后在各个已知的信息处理(lǐ)任務(wù)中会有(yǒu)越来越多(duō)的机器竞争——虽然不能(néng)够流畅的掌握这些任務(wù)——将受到公众期望,随后逐渐变得无聊,并在我们察觉之前消失。
George:高层次概念和感应动作生成模型。深度學(xué)习在图片分(fēn)类方面的进步让人很(hěn)兴奋,并且有(yǒu)很(hěn)多(duō)有(yǒu)用(yòng)的工作正被完成,进而促使不同领域的视觉性问题的解决,如侦测、语义分(fēn)割等等。