美國(guó)开放人工智能(néng)研究中心(OpenAI)13日展示最新(xīn)版本ChatGPT:与使用(yòng)者展开语音对话、识别图像并展开讨论、翻译……相比先前版本,它与使用(yòng)者对话基本无延迟,会倾听,能(néng)唠嗑,还善于察言观色,让人惊呼新(xīn)版本ChatGPT“更像人”了。新(xīn)版本ChatGPT取得了哪些突破?能(néng)在哪些领域实现应用(yòng)?它对人工智能(néng)领域的影响有(yǒu)多(duō)大?
有(yǒu)哪些“进化”
开放人工智能(néng)研究中心13日发布的人工智能(néng)模型名為(wèi)GPT-4o,编号中的字母“o”代表“omni”(全能(néng)),既能(néng)接受文(wén)本、音频和图像的任意组合输入,还能(néng)生成文(wén)本、音频和图像的相关回应。
该中心不仅围绕GPT-4o做了直播演示,还在社交媒體(tǐ)发布更多(duō)视频“炫技”。
在一段视频中,GPT-4o听起来明显“更会聊天了”,还时不时抛出几个笑话。它的音调有(yǒu)些许变化,言语间带着笑意,与它聊天更像与真人交谈。
实时聊天是ChatGPT的关键技能(néng)。相比先前版本,GPT-4o的不同主要表现在:一是使用(yòng)者可(kě)以随时打断聊天机器人,无需像从前那样等它把话说完;二是它会实时对问题作出回应,不再有(yǒu)两到三秒(miǎo)的时滞;三是它能(néng)感知人的情绪,比如演示者呼吸急促,它会询问对方是否需要稍稍稳定下情绪。另外,GPT-4o可(kě)以生成不同风格的声音。
演示中,GPT-4o利用(yòng)其视觉和语音能(néng)力,指导演示者在纸上逐步解出一道方程题,而不是直接给出答(dá)案。它还展示了英语与意大利语互译、用(yòng)自拍照片识别情绪等能(néng)力。当一名演示者告诉它,自己正展示它是“多(duō)么有(yǒu)用(yòng)和不可(kě)思议”时,它回答(dá)道:“哦,快别说了,怪害臊的。”
开放人工智能(néng)研究中心首席执行官萨姆·奥尔特曼在博客中写道,GPT-4o就像電(diàn)影中的人工智能(néng)技术。“与電(diàn)脑交谈一直让我感觉不自然,现在自然了。”
应用(yòng)潜力如何
北京邮電(diàn)大學(xué)人机交互与认知工程实验室主任刘伟说,无论是在文(wén)本生成、做题、问答(dá)系统还是情感分(fēn)析等任務(wù)中,GPT-4o都表现出很(hěn)好的能(néng)力。这种技术的突破,无疑将对國(guó)内外的相关企业产生重大影响,它不仅推动了自然语言处理(lǐ)技术的发展,也让人工智能(néng)在多(duō)个领域的应用(yòng)变得更加广泛和深入。
近年来,开发更人性化、功能(néng)更强大的生成式人工智能(néng)工具竞争激烈。就在开放人工智能(néng)研究中心发布GPT-4o的第二天,谷歌开发者年度会议召开,人工智能(néng)是重头戏。硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分(fēn)别投资开发了聊天机器人Grok和Pi,将拟人化特点作為(wèi)产品主攻方向。
英國(guó)广播公司的评论说,GPT-4o能(néng)够结合文(wén)本、音频和图像内容瞬间做出反应,目前在竞争中处于领先地位。
开放人工智能(néng)研究中心首席技术官米拉·穆拉蒂说,GPT-4o定于几周内上線(xiàn),用(yòng)户可(kě)免费试用(yòng)。ChatGPT原有(yǒu)付费用(yòng)户将获得新(xīn)版本更多(duō)使用(yòng)权限。
需要担心什么
在开放人工智能(néng)研究中心公布的一段演示视频中,GPT-4o一步步引导一名男孩解答(dá)出数學(xué)题。一些网友直呼,再也不用(yòng)辅导孩子写作业了。一些人却担心,教师这一职业会不会被人工智能(néng)取代。
一些人工智能(néng)专家认為(wèi),新(xīn)版ChatGPT虽然可(kě)能(néng)比竞争对手水平更高且更易使用(yòng),但不太可(kě)能(néng)很(hěn)快让一些职业彻底消失,从事教學(xué)或翻译工作的人更有(yǒu)可(kě)能(néng)会使用(yòng)这些工具,而不是被它们取代。
新(xīn)加坡人工智能(néng)计划人工智能(néng)产品高级总监莱斯利·特奥说,教學(xué)工作涉及人类的同理(lǐ)心,“教师自己经历了學(xué)习过程并且了解人如何克服困难,而人工智能(néng)不同”。他(tā)认為(wèi),教學(xué)、翻译和客户服務(wù)等工作不可(kě)能(néng)因GPT-4o的出现而消失。
也有(yǒu)一些专家认為(wèi),技术演示能(néng)在大多(duō)数人中引起反响,它通常是精心打造的,未必能(néng)反映产品的真实功能(néng)。
刘伟说,GPT-4o的语音功能(néng)改变了对话式人工智能(néng)的游戏规则,但依然没有(yǒu)实现聊天机器人的深度态势感知能(néng)力,比如意图理(lǐ)解、动机分(fēn)析等。此外,GPT-4o的进步在人工智能(néng)伦理(lǐ)和安全方面带来了新(xīn)的挑战,需要我们在数据隐私、信息可(kě)信性、潜在偏见、恶意使用(yòng)、意识和责任等方面开展新(xīn)的思考。(记者陈丹 袁原)