近日,美國(guó)OpenAI公司正式发布文(wén)生视频模型Sora,再次在全球掀起了人工智能(néng)关注浪潮。业内人士认為(wèi),从当前展示效果来看,Sora显著领先于其他(tā)文(wén)生视频模型,后续潜在的商(shāng)业化有(yǒu)望对短视频、電(diàn)影、游戏等下游领域产生深遠(yuǎn)影响,并进而传导到上游算力基础设施,算力需求有(yǒu)望再次迎来爆发。
文(wén)生视频探索新(xīn)高度
美國(guó)OpenAI公司发布的全新(xīn)的Sora文(wén)生视频模型,可(kě)以根据用(yòng)户输入的文(wén)本指令,一次生成60秒(miǎo)的長(cháng)视频,且视频的画面精细度、流畅度超越了以往的文(wén)生视频模型。由于Sora能(néng)够模拟对世界状态产生简单影响的行為(wèi),有(yǒu)分(fēn)析人士认為(wèi),这将文(wén)生视频能(néng)力推向了全新(xīn)的高度。
在Sora发布之后,有(yǒu)博主对当前市场上其他(tā)主流文(wén)生视频产品做了对比评测,在对Sora、Pika、Runway和Stable Video四个模型输入了相同的提示词后,Sora在视频生成质量和时间上均对同行“降维打击”,其更加清晰连贯、符合描述。
在OpenAI官方的技术报告中,对Sora的定位為(wèi)“作為(wèi)世界模拟器的视频生成模型”。“之前几款主流模型生成的视频时長(cháng)仅在20秒(miǎo)以内,Sora不仅能(néng)够深入理(lǐ)解用(yòng)户提示,还學(xué)会了物(wù)理(lǐ)世界的部分(fēn)规律,比如:一个人吃汉堡后会留下咬痕、火車(chē)車(chē)窗上会产生逼真的倒影,Sora还可(kě)在单个视频中设计出多(duō)个镜头。”华金证券计算机首席分(fēn)析师方闻千说。
360集团创始人周鸿祎表示,以往文(wén)生视频软件都是在2D平面上对图形元素进行操作,可(kě)以把视频看成是多(duō)个真实图片的组合,并没有(yǒu)真正掌握这个世界的知识。这次OpenAI利用(yòng)它的大语言模型优势,让Sora实现了对现实世界的理(lǐ)解和对世界的模拟两层能(néng)力,这样产生的视频才是“真实”的。
业内人士表示,虽然OpenAI表示当前Sora仍有(yǒu)弱点,例如难以准确模拟复杂场景中的物(wù)理(lǐ)现象,可(kě)能(néng)无法理(lǐ)解具體(tǐ)的因果关系,但从当前展示的效果来看,Sora显著领先于其他(tā)文(wén)生视频模型,推动AI视频生成“进入了一个全新(xīn)的时代”。
通用(yòng)人工智能(néng)加速到来
目前,Sora暂未公开使用(yòng)权限,仅对一部分(fēn)视觉艺术家、设计师和電(diàn)影制作人开放。业内人士认為(wèi),随着技术的进一步成熟,Sora将会推向所有(yǒu)用(yòng)户。Sora预示AGI(通用(yòng)人工智能(néng))将加速到来,其后续潜在的商(shāng)业化有(yǒu)望对短视频、電(diàn)影、游戏等下游领域产生深遠(yuǎn)影响。
值得一提的是,日前大火的游戏《幻兽帕鲁》的开发团队仅有(yǒu)4人,市场猜测该团队使用(yòng)了AI生成技术制作游戏角色,以节省成本。根据OpenAI发布的最新(xīn)Sora技术报告,Sora能(néng)够模拟视频游戏的数字化过程。这意味着,开发制作游戏的门槛可(kě)能(néng)会被进一步降低。
“有(yǒu)了强大AI能(néng)力的加持,OpenAI通往商(shāng)业成功之路缺的并不是程序员,而是能(néng)实现商(shāng)业闭环的‘金点子’。一旦任務(wù)明确,OpenAI就可(kě)以很(hěn)快复制,解决任何能(néng)力短板。”中经社區(qū)块链首席经济分(fēn)析师郭兴华说。
天风证券认為(wèi),随着OpenAI发布Sora文(wén)生视频模型能(néng)力大幅提升,内容创作工作流有(yǒu)望被颠覆,下一个亿级用(yòng)户的互联网平台雏形已然出现。2000亿美元的短视频创作生态有(yǒu)望率先被颠覆,生成式AI在视频创作和世界模型领域的大踏步进步将实现对视频、3D、游戏等下游应用(yòng)场景的渗透。
此前,A股有(yǒu)不少上市公司曾披露文(wén)生视频有(yǒu)关布局。因赛集团1月26日发布的调研纪要显示,公司的Insight GPT预计于2024年3月底前开发实现文(wén)生视频功能(néng),之后推出公测版正式启动商(shāng)业化,公司目前已收到几家汽車(chē)、快消行业知名品牌方发出的AIGC(生成式人工智能(néng))营销项目投标邀请。
“Sora的诞生意味着AGI实现可(kě)能(néng)从10年缩短至一两年。”周鸿祎认為(wèi),Sora只是小(xiǎo)试牛刀(dāo),它展现的不仅仅是视频制作的能(néng)力,而是大模型对真实世界有(yǒu)了理(lǐ)解和模拟之后,会带来新(xīn)的成果和突破。有(yǒu)了大模型技术作為(wèi)基础,再加上人类知识的引导,可(kě)以创造各个领域的超级工具,例如在生物(wù)医學(xué)、蛋白质、基因研究,物(wù)理(lǐ)、化學(xué)、数學(xué)的學(xué)科(kē)研究方面,大模型都会发挥作用(yòng)。
算力需求再迎爆发
业内认為(wèi),Sora强大的文(wén)生视频能(néng)力将快速推进应用(yòng)端商(shāng)业化落地、拉动产业规模,进而传导到上游算力基础设施,算力需求将再次迎来爆发。
据了解,Sora所需token(文(wén)本处理(lǐ)最小(xiǎo)单位)数量相较于文(wén)本及图片模型的推理(lǐ)呈数量级增長(cháng)。经中信证券简单估算,对于一个60帧的视频(约6至8秒(miǎo)),Sora要生成至少约120万个token,这是相当大的计算量。
“最强AI比拼的终点就是算力。”郭兴华表示,為(wèi)了更快和更好地实现对视频的渲染和合成,高性能(néng)计算机和计算芯片的需求将进一步释放。科(kē)技爆炸的背后需要算力膨胀来匹配,AI芯片将是这场变革中最核心的高地。
OpenAI的CEO萨姆·奥尔特曼表示,正在与投资者进行洽谈,旨在提高全球芯片产能(néng),扩大其支撑AI性能(néng)的能(néng)力,该项目可(kě)能(néng)需要筹集至多(duō)5万亿至7万亿美元资金。奥尔特曼建议,OpenAI、投资者、芯片制造商(shāng)和電(diàn)力供应商(shāng)建立合作关系,共同出资建立芯片工厂。
中信证券表示,本次OpenAI的模型更新(xīn)仍然是围绕底层算法层面,除去应用(yòng)端的投资机会,硬件端的需求也必然会随着多(duō)模态的技术进步而不断提升。持续看好AI算力层面,尤其是得益于商(shāng)业端成熟而带来的更多(duō)的AI推理(lǐ)侧算力的机会。
华金证券认為(wèi),AI技术的快速发展催生了算力需求的快速提升,為(wèi)國(guó)内外算力产业链带来了巨大的发展机遇。逻辑芯片市场空间巨大,國(guó)产厂商(shāng)具有(yǒu)巨大的替代空间。半导體(tǐ)行业在经历2022年、2023年的去库存周期后,销售额有(yǒu)望在2024年迎来复苏。(记者 闫鹏 李唐宁)