大模型展现出的通用(yòng)智能(néng)能(néng)力具有(yǒu)重要的现实意义和影响力,是人工智能(néng)发展中里程碑式的进展。大模型带来的智能(néng)革命,将媲美工业革命和電(diàn)力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能(néng)时代的那一台“蒸汽机”。
要问今年最热的科(kē)技热点是什么,许多(duō)人会脱口而出——大模型。从年初ChatGPT引发的大模型浪潮,到相关科(kē)技企业上線(xiàn)自家大模型产品,“百模大战”不断升级,它所引发的人工智能(néng)“地震”还在持续。
进入9月,國(guó)内科(kē)技厂商(shāng)在大模型领域动作频频。9月初,此前一直处于内测阶段的多(duō)款大模型产品完成备案,正式上線(xiàn),面向公众开放。9月21日,在华為(wèi)全联接大会2023上,因在众多(duō)领域展示了大模型发展的更多(duō)可(kě)能(néng),盘古大模型成為(wèi)当之无愧的主角。
“百模大战”也好,“群模起舞”也罢,技术进步和创新(xīn)喷涌的热潮中,人们关注的焦点集中于,我们究竟需要什么样的大模型?何种大模型是通向人工智能(néng)的最终答(dá)案?
智能(néng)时代的“蒸汽机”
现在到底有(yǒu)多(duō)少个大模型产品?似乎没有(yǒu)人能(néng)给出准确的答(dá)案。
赛迪顾问发布的《2023大模型现状调查报告》显示,截至2023年7月底,國(guó)外累计发布大模型138个,中國(guó)则累计有(yǒu)130个大模型问世。
但这股浪潮的源头很(hěn)清楚,正是ChatGPT。
2022年末,由名不见经传的人工智能(néng)公司Open AI打造的大语言模型ChatGPT横空出世,人们可(kě)以使用(yòng)最日常的语言与其对话,让它回答(dá)各种问题、完成各类书面任務(wù),聊天、画图、敲代码……人们第一次如此近距离地感受到人工智能(néng)带来的震撼,也让“大模型”这个此前只為(wèi)少数人工智能(néng)领域从业者所知的专业概念,成為(wèi)了被人们挂在嘴边、反复提及的词汇。
输入内容、进行计算、产出结果,这是人工智能(néng)模型的本质,但大模型的与众不同之处正在于其足够“大”。
巨大的参数数量、庞大复杂的算法结构、海量的训练数据以及强大的算力支撑,决定了大模型不同于普通的人工智能(néng)模型,其拥有(yǒu)强大的通用(yòng)智能(néng)。
以ChatGPT為(wèi)例,其早期3.0版本的参数数量已达到1750亿个,4.0版本的参数量更是指数级增加,达到1.8万亿个,训练数据的单位数量更是达到惊人的13万亿。相比之下,早期如围棋机器人AlphaGo等专用(yòng)人工智能(néng)模型,其参数量往往仅為(wèi)百万级,与大模型相去甚遠(yuǎn)。
海量的参数、复杂的算法、强大的训练能(néng)力,让大模型成為(wèi)具备横跨多(duō)领域學(xué)习能(néng)力的通用(yòng)人工智能(néng),实现了所谓的“智能(néng)涌现”,即拥有(yǒu)触类旁通、举一反三的學(xué)习能(néng)力。如果说此前的人工智能(néng)模型还只是经过训练后可(kě)以完成某些特殊任務(wù)的“马戏团猴子”,那大模型则可(kě)以说已经是一个接受完义務(wù)教育的“中學(xué)毕业生”。
在北京智源人工智能(néng)研究院院長(cháng)、北京大學(xué)计算机學(xué)院教授黄铁军看来,大模型展现出的通用(yòng)智能(néng)能(néng)力具有(yǒu)重要的现实意义和影响力,是人工智能(néng)发展中里程碑式的进展,放眼人类历史、展望人类未来,大模型带来的智能(néng)革命,将媲美工业革命和電(diàn)力革命,深刻改变人类社会的生产生活方式。大模型,或许正是开启智能(néng)时代的那一台“蒸汽机”。
哪条赛道通“罗马”
ChatGPT引发的大模型热潮让许多(duō)科(kē)技巨头坐(zuò)不住了,纷纷将自家“压箱底”的大模型成果公之于众。
谷歌紧随ChatGPT脚步,发布了基于自家大语言模型的聊天机器人“Bard”,互动媒體(tǐ)与服務(wù)公司Meta也不甘落后,发布了同类大模型“Llama”。國(guó)内同样热闹非凡,3月份,百度率先发布研发十余年的知识增强大语言模型“文(wén)心一言”。随后,360发布“360智脑”,阿里巴巴上線(xiàn)“通义千问”,科(kē)大讯飞推出“讯飞星火”,腾讯推出“混元”,华為(wèi)推出“盘古”……一众科(kē)技公司不甘落后地推出了各自的大模型产品。
彼时,面向公众发布的大模型产品均為(wèi)内测使用(yòng),公众需提出申请,获得内测资格后才能(néng)进行體(tǐ)验。7月10日,國(guó)家网信办联合國(guó)家发改委、教育部、科(kē)技部等七部门审议通过并发布《生成式人工智能(néng)服務(wù)管理(lǐ)暂行办法》(以下简称《办法》),该《办法》8月15日起正式施行。《办法》明确规定,提供具有(yǒu)舆论属性或者社会动员能(néng)力的生成式人工智能(néng)服務(wù)的,应当按照國(guó)家有(yǒu)关规定开展安全评估,并履行算法备案等手续。8月底,一批完成算法备案的大模型产品陆续上線(xiàn),正式面向公众开放。
或许是ChatGPT带来的震撼过于强烈,以自然语言对话為(wèi)主要功能(néng)體(tǐ)验的大语言模型产品成為(wèi)许多(duō)科(kē)技厂商(shāng)的首选,甚至一度成為(wèi)大模型的代名词。首批通过备案上線(xiàn)的大模型产品中有(yǒu)百度的“文(wén)心一言”、字节跳动的“豆包”、智谱华章的“智谱清言”等。截至9月底,已有(yǒu)十余家大语言模型产品官宣上線(xiàn),大部分(fēn)均提供聊天对话、创意写作、代码生成等服務(wù)。
但在大语言模型之外,也有(yǒu)厂商(shāng)选择了另一条道路,不“恋战”大语言模型,而是直面行业具體(tǐ)问题。
在9月21日举办的华為(wèi)全联接大会2023上,华為(wèi)常務(wù)董事、华為(wèi)云CEO张平安表示,盘古大模型要帮助各行各业的客户解最难的题。例如,在矿山(shān)领域,精煤产率是困扰业界多(duō)年的难题,山(shān)东能(néng)源集团已将“盘古”矿山(shān)大模型全面应用(yòng)到采、掘、机、运、通等9大业務(wù)系统、21个场景中。在“盘古”的助力下,济宁二号煤矿每年能(néng)多(duō)产出8000吨精煤,精煤产率提升千分(fēn)之二,增收约2000万元。
在正在举办的亚运会上,也少不了大模型的身影。由浙江移动打造的亚运保障网络运维大模型在幕后為(wèi)亚运会保驾护航。它让保障人员“无论在哪,无论何时”都能(néng)以“对话”方式获取保障情况,全面提升了亚运会保障的工作效率,降低了保障工作的技术门槛。
浙江移动网管中心副总经理(lǐ)方炜告诉科(kē)技日报记者,无论是面向具體(tǐ)行业的垂直大模型,还是直面公众的大语言模型,从底层技术来看,二者并不冲突。“这两种选择就像是此前的互联网发展,既有(yǒu)改变人们生活的移动互联网,也有(yǒu)改变社会、改变行业的产业互联网。大模型也是基于通用(yòng)的底层技术,衍生出了不同用(yòng)途。比如浙江移动的网络运维大模型就是使用(yòng)通用(yòng)大模型通过微调和提示工程来满足亚运网络保障的场景。”
垂直大模型和通用(yòng)大模型,究竟哪条赛道能(néng)够通向终极人工智能(néng)的“罗马城”,答(dá)案或许是——条条大路通罗马。
“万模群舞”或在不遠(yuǎn)的将来
无论是何种类型的大模型,在“百模大战”的背景下,其功能(néng)、用(yòng)途、场景的重复都无法避免。但在业内人士看来,大模型的发展还遠(yuǎn)未触及天花(huā)板,不仅“百模大战”不是终点,“万模群舞”或许就在不遠(yuǎn)的将来。
“大模型的研发是一个拼细节的过程。从技术路線(xiàn)上看,目前各家基本上都是基于Transformer架构来做,方法很(hěn)类似,但效果确实不一样,决定成败的是细节。”腾讯有(yǒu)关负责人接受采访时说,由于资源投入程度、细节把握程度的不同,最后不同产品的差异会逐渐显现。“从应用(yòng)领域来说,会迎来一个‘百花(huā)齐放’的场景,比如有(yǒu)的专注于自然语言处理(lǐ),有(yǒu)的专注于医疗领域,有(yǒu)的专注于教育领域等。就目前而言,大模型的天花(huā)板还遠(yuǎn)遠(yuǎn)没有(yǒu)触到,技术體(tǐ)系和应用(yòng)场景都在不断演进。”腾讯有(yǒu)关负责人说。
无论是“百模大战”还是“万模群舞”,要避免低水平的雷同复制,杜绝“重复造轮子”带来的资源浪费,关键仍在于不断丰富大模型的应用(yòng)生态。今年5月,國(guó)际期刊《自然》发表了一项百度在生物(wù)计算领域的突破性研究成果,其提出的mRNA序列优化算法LinearDesign,对生物(wù)医學(xué)领域创新(xīn)具有(yǒu)重要价值,这也是中國(guó)互联网科(kē)技企业首次以第一完成单位的身份在《自然》正刊发表成果。而在这背后,是百度在2022年5月便推出的“文(wén)心”生物(wù)计算大模型。借助大模型,人类能(néng)够快速找到并设计出活性更好、性质更优的候选药物(wù)分(fēn)子,从而大幅提升新(xīn)药研发和疫苗设计效率,让新(xīn)药研发从单点突破的“手工作坊”阶段进入到规模开发阶段。目前,基于“文(wén)心”生物(wù)计算大模型和飞桨深度學(xué)习框架搭建的面向小(xiǎo)分(fēn)子、大分(fēn)子和RNA的药物(wù)设计平台——飞桨螺旋桨PaddleHelix,已经应用(yòng)于超过30家医药企业。
“无论是从技术层面还是产品层面,百花(huā)齐放、百家争鸣对于当下大模型发展都更加有(yǒu)利。算法研究阶段可(kě)能(néng)五花(huā)八门,但到工程选型阶段,可(kě)能(néng)会逐渐聚焦到一个或少数几个类型。而到了具體(tǐ)产品选型层面,面向不同市场、不同行业,产品形态可(kě)能(néng)又(yòu)是多(duō)种多(duō)样的。”清华大學(xué)计算机系教授唐杰认為(wèi),无论哪种大模型都有(yǒu)各自的局限性,各种模型互相學(xué)习、竞争,在市场中大浪淘沙是必经之路。
给大模型发展更多(duō)耐心
“百模大战”虽然激发出了更多(duō)可(kě)能(néng),但也带来了不少负面影响。当众多(duō)厂商(shāng)蜂拥而上大模型时,参差不齐的产品让人眼花(huā)缭乱,其中暗藏的法律、道德风险也应引起人们的警惕。
例如,在面向公众的大语言模型产品中,“一本正经胡说八道”现象已经多(duō)次引发质疑。“我们常说大模型会产生‘幻觉’,就是因為(wèi)大模型的内容准确性还不高、专业性能(néng)力不足,如果大模型产生的内容直接公开在互联网,会使当前良莠不齐的互联网信息质量更加低下。”方炜认為(wèi),大模型目前在内容安全、版权、主體(tǐ)责任等方面还存在多(duō)种风险。
而当深入到具體(tǐ)行业时,不同行业的不同特点也对大模型在准确度、安全性、专业性等方面提出更高要求。360创始人周鸿祎接受采访时表示,虽然公开的大模型是通用(yòng)的,甚至是万能(néng)的,但是当深入到具體(tǐ)行业时仍然面临着缺乏行业深度、不懂企业内部知识、易导致企业内部数据泄露、无法控制成本等问题。方炜也同意这种说法:“例如大模型应用(yòng)在通信网络保障方面时,就不允许有(yǒu)任何差错,目前准确性还有(yǒu)待提升。”
除了目前大模型自身仍然存在的缺陷,随着竞争的逐渐激烈,我國(guó)在相关数据、算力、算法等方面的困境也逐渐暴露。
例如,在训练数据方面,唐杰指出,目前我國(guó)的数据开放态势并不强,“大多(duō)数机构还是想把数据握在自己手里”。但唐杰也坦承,即使机构有(yǒu)数据开源的意愿,在目前环境下,仍然存在多(duō)重风险。他(tā)建议,我國(guó)关于大模型训练数据应用(yòng)、开源的相关法律法规还需要进一步细化、健全,让有(yǒu)开源意愿的机构能(néng)够放心地进行数据开源,充分(fēn)激发互联网精神。
而在算力方面,“百模大战”对算力的高需求也让我國(guó)本就紧张的算力资源更加捉襟见肘。在“东数西算”基础上建立起的算力互联网或许有(yǒu)望成為(wèi)解决这一问题的答(dá)案。通过对不同地區(qū)的算力资源进行调度,实现算力资源的均衡分(fēn)配。但目前仍然需要在高带宽、低延迟的算力网络建设方面突破更多(duō)技术瓶颈。
如果说数据和算力是大模型的硬件“基础设施”,算法则體(tǐ)现着更多(duō)“人”的因素。小(xiǎo)冰公司首席执行官李笛认為(wèi),就训练大模型而言,参数的数量并不是最重要的,工程化过程中的调优才是真正的考验。“研发、训练一个大模型可(kě)能(néng)只需要一个月,但调优可(kě)能(néng)需要一年的时间。这个过程格外需要谨慎、细致、耐心,有(yǒu)足够的定力和专注力,也是一种‘工匠精神’的體(tǐ)现。”
耐心,是谈及大模型发展时多(duō)位业内专家反复提及的关键词。“大模型不是把数据‘喂’进去,算力一跑就有(yǒu)了。这其中有(yǒu)许多(duō)复杂细致的工作要做。”唐杰表示,人工智能(néng)自20世纪50年代被提出至今,其发展已经历过多(duō)次起伏,任何技术的发展都不是一蹴而就的,要对其有(yǒu)充分(fēn)耐心。