技术手段助大模型成本“瘦身”-中國(guó)信息化•中國(guó)信息协会

技术手段助大模型成本“瘦身”

来源：科(kē)技日报作者：发布时间： 2024-05-17

“降价的基本逻辑是，我们有(yǒu)信心用(yòng)技术手段降低成本，市场也需要更低价的大模型。”5月15日，字节跳动豆包大模型在火山(shān)引擎原动力大会上发布，火山(shān)引擎总裁谭待在公布豆包大模型定价时如是说。

豆包大模型的超低价格引起业内关注。据悉，豆包主力模型的推理(lǐ)输入价格只有(yǒu)0.0008元/千Tokens（数据中的基本单元），比行业价格便宜99.3%。对此，谭待坦言：“降价是用(yòng)技术优化成本来实现的。如果只是补贴，用(yòng)亏损换收入是不可(kě)持续的，我们不会走这条路。”

对大模型推理(lǐ)成本的优化，可(kě)通过很(hěn)多(duō)技术手段实现。首先是模型本身，模型结构、训练方法都可(kě)以持续改进，包括业界很(hěn)关注的MoE（混合专家模型），就是优化推理(lǐ)成本很(hěn)好的解决方案。其次是工程上的优化。大模型的调用(yòng)量越大，优化推理(lǐ)成本的空间也越大。以前的模型都是单机推理(lǐ)，大模型用(yòng)的是分(fēn)布式推理(lǐ)。所以如果能(néng)把各种各样的底层算力用(yòng)得更好，推理(lǐ)成本就会大大降低。

谭待表示，豆包大模型平均每天处理(lǐ)1200亿Tokens文(wén)本、生成3000万张图片，不同任務(wù)有(yǒu)不同的负载，可(kě)以把它们混合在一起，通过智能(néng)调度提高它们的利用(yòng)率，就能(néng)极大地提升资源利用(yòng)率，实现整體(tǐ)成本的优化。

“大的使用(yòng)量，才能(néng)打磨出好模型，大幅降低模型推理(lǐ)的单位成本。”谭待拿(ná)字节跳动内部业務(wù)举例，飞书的主要流量高峰在工作时间，抖音在下班后休闲时间的流量更高，这些不同业務(wù)的大模型推理(lǐ)，也能(néng)根据业務(wù)特点错峰使用(yòng)，降低成本。

豆包大模型原名“云雀”，是國(guó)内首批通过算法备案的大模型之一。字节跳动基于豆包大模型打造了AI对话助手“豆包”、AI应用(yòng)开发平台“扣子”、互动娱乐应用(yòng)“猫箱”，以及星绘、即梦等AI创作工具，并把大模型接入抖音、番茄小(xiǎo)说、飞书、巨量引擎等50余个业務(wù)，用(yòng)以提升效率和优化产品體(tǐ)验。

大模型从以分(fēn)计价到以厘计价，将助力企业以更低成本加速业務(wù)创新(xīn)。“比如一个人现在要创业，如果要花(huā)1万元钱调用(yòng)大模型，可(kě)能(néng)会觉得有(yǒu)点贵。我们把价格降到1%都不到，相当于花(huā)100元钱，就能(néng)把大模型用(yòng)起来，相关想法也就更容易得到尝试。”谭待表示，企业的AI转型充满不确定性，试错成本要尽量低，才能(néng)更快更多(duō)地实现大模型的应用(yòng)落地，从而让整个行业受益。（记者杨雪(xuě)）

下一篇：新(xīn)版ChatGPT在哪些方面“更像人”

地方动态

中國(guó)信息协会会長(cháng)王金平参加第七届数字中國(guó)建设峰会

全國(guó)大學(xué)生创新(xīn)发明大赛暨“英创工程”启动

赋能(néng)未来，共创数智化新(xīn)纪元：中國(guó)信息协会集团企业数字化工作委员会正式成立

中國(guó)信息协会第四届信息技术服務(wù)业应用(yòng)技能(néng)大赛新(xīn)闻发布会在京召开

协会要闻
通知公告


关注中國(guó)信息协会官微	关注中國(guó)信息化网官微