新(xīn)版ChatGPT在哪些方面“更像人”
来源: 新(xīn)华社 作者: 发布时间: 2024-05-16

美國(guó)开放人工智能(néng)研究中心(OpenAI)13日展示最新(xīn)版本ChatGPT:与使用(yòng)者展开语音对话、识别图像并展开讨论、翻译……相比先前版本,它与使用(yòng)者对话基本无延迟,会倾听,能(néng)唠嗑,还善于察言观色,让人惊呼新(xīn)版本ChatGPT“更像人”了。新(xīn)版本ChatGPT取得了哪些突破?能(néng)在哪些领域实现应用(yòng)?它对人工智能(néng)领域的影响有(yǒu)多(duō)大?

有(yǒu)哪些“进化”

开放人工智能(néng)研究中心13日发布的人工智能(néng)模型名為(wèi)GPT-4o,编号中的字母“o”代表“omni”(全能(néng)),既能(néng)接受文(wén)本、音频和图像的任意组合输入,还能(néng)生成文(wén)本、音频和图像的相关回应。

该中心不仅围绕GPT-4o做了直播演示,还在社交媒體(tǐ)发布更多(duō)视频“炫技”。

在一段视频中,GPT-4o听起来明显“更会聊天了”,还时不时抛出几个笑话。它的音调有(yǒu)些许变化,言语间带着笑意,与它聊天更像与真人交谈。

实时聊天是ChatGPT的关键技能(néng)。相比先前版本,GPT-4o的不同主要表现在:一是使用(yòng)者可(kě)以随时打断聊天机器人,无需像从前那样等它把话说完;二是它会实时对问题作出回应,不再有(yǒu)两到三秒(miǎo)的时滞;三是它能(néng)感知人的情绪,比如演示者呼吸急促,它会询问对方是否需要稍稍稳定下情绪。另外,GPT-4o可(kě)以生成不同风格的声音。

演示中,GPT-4o利用(yòng)其视觉和语音能(néng)力,指导演示者在纸上逐步解出一道方程题,而不是直接给出答(dá)案。它还展示了英语与意大利语互译、用(yòng)自拍照片识别情绪等能(néng)力。当一名演示者告诉它,自己正展示它是“多(duō)么有(yǒu)用(yòng)和不可(kě)思议”时,它回答(dá)道:“哦,快别说了,怪害臊的。”

开放人工智能(néng)研究中心首席执行官萨姆·奥尔特曼在博客中写道,GPT-4o就像電(diàn)影中的人工智能(néng)技术。“与電(diàn)脑交谈一直让我感觉不自然,现在自然了。”

应用(yòng)潜力如何

北京邮電(diàn)大學(xué)人机交互与认知工程实验室主任刘伟说,无论是在文(wén)本生成、做题、问答(dá)系统还是情感分(fēn)析等任務(wù)中,GPT-4o都表现出很(hěn)好的能(néng)力。这种技术的突破,无疑将对國(guó)内外的相关企业产生重大影响,它不仅推动了自然语言处理(lǐ)技术的发展,也让人工智能(néng)在多(duō)个领域的应用(yòng)变得更加广泛和深入。  

近年来,开发更人性化、功能(néng)更强大的生成式人工智能(néng)工具竞争激烈。就在开放人工智能(néng)研究中心发布GPT-4o的第二天,谷歌开发者年度会议召开,人工智能(néng)是重头戏。硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分(fēn)别投资开发了聊天机器人Grok和Pi,将拟人化特点作為(wèi)产品主攻方向。

英國(guó)广播公司的评论说,GPT-4o能(néng)够结合文(wén)本、音频和图像内容瞬间做出反应,目前在竞争中处于领先地位。

开放人工智能(néng)研究中心首席技术官米拉·穆拉蒂说,GPT-4o定于几周内上線(xiàn),用(yòng)户可(kě)免费试用(yòng)。ChatGPT原有(yǒu)付费用(yòng)户将获得新(xīn)版本更多(duō)使用(yòng)权限。

需要担心什么

在开放人工智能(néng)研究中心公布的一段演示视频中,GPT-4o一步步引导一名男孩解答(dá)出数學(xué)题。一些网友直呼,再也不用(yòng)辅导孩子写作业了。一些人却担心,教师这一职业会不会被人工智能(néng)取代。

一些人工智能(néng)专家认為(wèi),新(xīn)版ChatGPT虽然可(kě)能(néng)比竞争对手水平更高且更易使用(yòng),但不太可(kě)能(néng)很(hěn)快让一些职业彻底消失,从事教學(xué)或翻译工作的人更有(yǒu)可(kě)能(néng)会使用(yòng)这些工具,而不是被它们取代。

新(xīn)加坡人工智能(néng)计划人工智能(néng)产品高级总监莱斯利·特奥说,教學(xué)工作涉及人类的同理(lǐ)心,“教师自己经历了學(xué)习过程并且了解人如何克服困难,而人工智能(néng)不同”。他(tā)认為(wèi),教學(xué)、翻译和客户服務(wù)等工作不可(kě)能(néng)因GPT-4o的出现而消失。

也有(yǒu)一些专家认為(wèi),技术演示能(néng)在大多(duō)数人中引起反响,它通常是精心打造的,未必能(néng)反映产品的真实功能(néng)。

刘伟说,GPT-4o的语音功能(néng)改变了对话式人工智能(néng)的游戏规则,但依然没有(yǒu)实现聊天机器人的深度态势感知能(néng)力,比如意图理(lǐ)解、动机分(fēn)析等。此外,GPT-4o的进步在人工智能(néng)伦理(lǐ)和安全方面带来了新(xīn)的挑战,需要我们在数据隐私、信息可(kě)信性、潜在偏见、恶意使用(yòng)、意识和责任等方面开展新(xīn)的思考。(记者陈丹 袁原


地方动态

中國(guó)信息协会会長(cháng)王金平参加第七届数字中國(guó)建设峰会

全國(guó)大學(xué)生创新(xīn)发明大赛暨“英创工程”启动

赋能(néng)未来,共创数智化新(xīn)纪元:中國(guó)信息协会集团企业数字化工作委员会正式成立

中國(guó)信息协会第四届信息技术服務(wù)业应用(yòng)技能(néng)大赛新(xīn)闻发布会在京召开

  • 协会要闻
  • 通知公告