OpenAI和谷歌再度燃起争霸烽火
来源: 科(kē)技日报 作者: 发布时间: 2024-05-17

OpenAI与谷歌的又(yòu)一次技术交锋刚刚落下帷幕。

北京时间5月14日凌晨,OpenAI发布了新(xīn)一代多(duō)模态人工智能(néng)(AI)大模型GPT-4o,其先进的AI语音交互技术迅速吸引了人们的目光。

一天之后,谷歌在北京时间15日凌晨的I/O 2024开发者大会上,携新(xīn)版Gemini AI大模型等尖端产品重装上阵,正面对决OpenAI,燃起新(xīn)一轮AI领域争霸的烽火。

GPT-4o语音对话丝滑如真人

一个拥有(yǒu)流畅、迷人嗓音的逼真AI,可(kě)以让人类用(yòng)户着迷并留下深刻的印象。调情、讲笑话、满足人类的欲望,并最终留住他(tā)们的心……这是2013年美國(guó)上映的電(diàn)影《她》中的情节。在这部影片中,一位叫萨曼莎的虚拟姑娘让孤独内向的男主深陷其中。

事实上,这也是OpenAI展示的新(xīn)模型GPT-4o所能(néng)让人联想到的情节。

据OpenAI介绍,GPT-4o是一个“原生多(duō)模态”模型。它命名中的o来源于“omni”一词,意為(wèi)“全能(néng)的”,有(yǒu)包罗万象之意。它可(kě)以接受文(wén)本、音频和图像任意组合的输入,并生成这些格式的相应输出。新(xīn)模型使ChatGPT能(néng)够处理(lǐ)50种不同的语言,速度和质量同时得到提高。它可(kě)以在短短232毫秒(miǎo)内处理(lǐ)音频输入,平均耗时320毫秒(miǎo),与人类对话中的反应时间相当。

GPT-4o允许ChatGPT以更加逼真的方式与用(yòng)户交流。它不仅能(néng)检测用(yòng)户声音中的情绪,分(fēn)析面部表情,还能(néng)根据用(yòng)户需求改变语调和节奏。如果想听睡前故事,它可(kě)以用(yòng)耳语说话。如果需要来一段带“酸味儿”的对话,它就能(néng)以轻松、讽刺的语气与人交谈。它甚至还可(kě)以按要求唱歌,一会儿是高亢的女高音,一会儿又(yòu)能(néng)变成迷人的女低音。

有(yǒu)趣的是,就在GPT-4o官宣发布后,一名OpenAI的员工发布了一条意味深長(cháng)的信息:“你们都会爱上它的。”

Astra让AI与人们生活无缝融合

OpenAI发布了GPT-4o后,压力就给到了谷歌。谷歌在发布会上,放出大招向OpenAI“开战”,势必要扳回一局。

谷歌在整个大会中共提到“AI”121次,并推出了从新(xīn)的搜索和聊天功能(néng)到面向云客户的AI硬件等十余种新(xīn)品和升级产品。其中包括由升级后Gemini模型驱动的AI助手项目Astra、对标Sora的文(wén)生视频模型Veo,以及第六代Tensor处理(lǐ)器单元(TPU)Trillium芯片。

Astra是一次旨在创建“通用(yòng)人工智能(néng)代理(lǐ)”的新(xīn)尝试。与GPT-4o一样,Astra具有(yǒu)以各种形式或多(duō)模式方式快速响应用(yòng)户的卓越能(néng)力,这使得它非常适合成為(wèi)AI助手。

谷歌表示,通过对视频帧和语音输入进行连续处理(lǐ)和编码,Astra可(kě)以创建事件时间轴并缓存信息,以便快速调用(yòng)。这使AI能(néng)看、能(néng)听、能(néng)说,甚至能(néng)回忆。在一段引人入胜的视频中,这款模型通过智能(néng)手机的摄像头识别出现实世界中的物(wù)體(tǐ),能(néng)直接读取代码,甚至能(néng)帮用(yòng)户回忆起他(tā)的眼镜落在了哪里,还能(néng)几乎零延迟与人实时对话。

生成式AI革命遠(yuǎn)未成功

自ChatGPT宣告问世,谷歌和OpenAI的竞争就不断升级。现在,两大科(kē)技巨头更是在两天时间里纷纷亮出引人瞩目的产品。

然而,生成式AI的飞速发展也伴随着众多(duō)质疑的声音。人们对于这些科(kē)技公司所塑造的“AI未来”仍持谨慎态度。

《新(xīn)科(kē)學(xué)家》杂志(zhì)网站称,人们应该认识到,生成式AI的成功还遠(yuǎn)未确定。这个领域还很(hěn)新(xīn),公司之间竞争的目的并不是市场份额或客户忠诚度,而仅仅是為(wèi)了拥有(yǒu)最新(xīn)产品。新(xīn)的GPT-4o尽管更有(yǒu)“人味儿”,但AI胡编乱造的行為(wèi)未必能(néng)得到限制。

根据美國(guó)皮尤研究中心的调查,尽管ChatGPT在过去几年声势浩大,但只有(yǒu)23%的美國(guó)成年人使用(yòng)过它。英國(guó)牛津大學(xué)卡丽莎·维利兹副教授称:“这项技术到底有(yǒu)多(duō)大影响,目前还很(hěn)不明确。大多(duō)数人尚未體(tǐ)验过生成式AI工具,有(yǒu)理(lǐ)由认為(wèi),这项技术最终可(kě)能(néng)不如一些人想象的那样具有(yǒu)革命性。”(记者 张佳欣


地方动态

中國(guó)信息协会会長(cháng)王金平参加第七届数字中國(guó)建设峰会

全國(guó)大學(xué)生创新(xīn)发明大赛暨“英创工程”启动

赋能(néng)未来,共创数智化新(xīn)纪元:中國(guó)信息协会集团企业数字化工作委员会正式成立

中國(guó)信息协会第四届信息技术服務(wù)业应用(yòng)技能(néng)大赛新(xīn)闻发布会在京召开

  • 协会要闻
  • 通知公告