2023年,几乎可以被定义为中国互联网公司的“大模型元年”。
ChatGPT的全球爆红,彻底点燃国内的大模型赛道,曾经的“创业英雄”、如今的商业领袖们亲自下场,接连发布生成式人工智能产品与大模型布局。
大模型火了,沉寂许久的互联网行业又有了新的“战事”。同时,大模型的快速发展也改变了云市场的现状,企业对算力的需求急剧增长,技术层面从单一云架构向“多云架构”转变的趋势日益显著。
2022年,字节跳动旗下云服务品牌“火山引擎”对4000多家在云上消耗超过100万的企业客户进行调研,他们发现,目前有88%的企业采用多云架构,平均每家企业会使用“五朵云”。
在多云架构趋势与大模型持续迭代的背景下,火山引擎总裁谭待认为,未来将是“多云多模型”的时代。
不难理解,如今国内云服务市场呈现多元化趋势,企业从不同厂商采买云服务已是常态,而大模型也不会一家独大,最终会形成多模型共生甚至协作的生态。
“在多云方面的实践,字节可以说是经验最丰富的一家。”谭待说。
具体到技术与业务层面,在“多云多模型”时代下,火山引擎如何为企业提供针对性的解决方案?
做好大模型的“基础设施”
大模型是人人都想摘得的“玫瑰枝”,但在国内落地实现的壁垒依然很高。
大模型的训练与迭代是对算力和数据的双重考验,也是对企业资金储备与战略定力的挑战;有业内人士估算过,OpenAI 训练 GPT-3 一年,算力成本就高达 2000 万美元。
尤其对中小科技企业或初创公司而言,建设大模型更具体的挑战在于,企业缺乏足够的应用场景实践和行为分析数据,在训练和迭代升级上也存在壁垒。
谭待也认为,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队、丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。
对此,火山引擎的解法是:为大模型客户提供高稳定性和高性价比的AI基础设施。
如何为大模型提供基础设施?据谭待透露,国内大模型领域七成以上企业是火山引擎客户,火山引擎将为他们提供关键的算力支持和技术平台,并为消费者带来更丰富的AI应用。
具体到产品端,近日,火山引擎发布新版机器学习平台:支持万卡大模型训练、微秒级延迟网络,让大模型训练更稳更快。
同时,火山引擎发布了基于自研DPU的Intel CPU计算实例、AMD CPU计算实例、NVIDIA GPU计算实例,以其中“DPU+AMD Genoa CPU平台的计算实例”为例,整机性能最高提升138%,单核性能最高提升39%。
算力是实现大模型迭代的关键一环,而火山引擎通过与字节跳动国内业务并池,将抖音等业务的空闲计算资源极速调度给火山引擎客户使用,确保企业在大模型建设中的数据支持与算力保障。
字节跳动副总裁杨震原表示,“并池”意味着可以调度一些资源,去错峰互用,把运力提上去,“比如其实也有波峰和波谷,凌晨用的人少,这种资源就很适合科学计算的能力。”
基于字节系的算力资源和生态能力,火山引擎所提供的大模型基础设施,在运算效率和性价比方面更有优势。
以火山引擎的合作客户MiniMax为例,这是一家已经推出自研大模型产品的独角兽公司,其与火山引擎合作建立的超大规模推理平台,拥有万卡级算力池,支撑单日过亿次调用。
再比如抖音的推荐系统,在火山引擎的算力支持下,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。
“火爆全网的抖音’AI绘画’特效,从启动到上线只用一周多,模型由一名算法工程师完成训练。”杨震原介绍说。
杨震原还认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。
效率更优、算力资源丰富、成本可控的大模型训练与迭代方式,往往是初创型科技公司最为看重的模式,也是火山引擎努力实现的目标。
谭待指出,火山引擎要服务好那些立志做好大模型的公司,为其提供基础算力支持和技术平台。“如何在工程上帮它们优化,提高效率,稳定性,都是我们关注的重点。”
当然,不同企业在不同应用场景下,对云服务和大模型的需求千差万别,火山引擎又如何做好个性化的企业级解决方案?
数据驱动,升级企业解决方案
从2020年成立至今,火山引擎基于内部业务的技术生态,已经向外开放机器翻译、视觉智能等能力,业务覆盖金融、汽车、消费、文娱等行业场景。
不过,事情正在起变化,“多云多模型”时代对云厂商提出更复杂的挑战。
一方面,企业加速搭建“多云架构”,以实现算力的快速增长;另一方面,多模型意味着多场景应用,企业在不同的业务场景中需要差异化的AI应用。
早在2022年,火山引擎就提出“体验创新、数据驱动、敏捷迭代”的云上增长三要素,基于企业不同的应用场景,利用数据驱动搭建云增长模型。
谭待认为,“过去很多企业花费了大量时间构建数据中台,但最后失败了,找不到数据应用的场景,价值也没有发挥出来。其本质在于,企业没有将数据驱动整个体系设计好。”
火山引擎非常看重数据驱动为企业降本增效、技术升级所带来的作用,内部对数据使用的价值也有一个明确标准——“0987”,即零事故、满足90%的需求、80%的需求能够通过技术优化实现秒级调用、通过业务部门评价达到70分以上。
坚持以数据驱动为增长核心,火山引擎能在内容、营销等领域提供更多个性化的企业级应用,比如在内容领域通过算法和AI平台帮助创作更优质内容、在内部运营方面通过数据平台优化供应链和库存管理等。
如今,火山引擎的解决方案已经在各行各业落地,进一步带动产业的数字化升级。
2022年卡塔尔世界杯期间,火山引擎就用AI的方式做出窄带高清,一方面提升视频帧率,另外还能降低带宽。
同时,针对网络观众收看比赛最头疼的直播延时问题,火山引擎通过RTM超低时延直播技术,将直播画面的端到端延迟最低降到1s,电视观众和网络观众几乎都能“同频”观看赛事直播。
此外,在公益领域,火山引擎与字节跳动公益将联合推出公益版的电子票据服务与公有云服务,为符合条件的公益组织提供为期3年的免费服务。
据地歌网了解,字节跳动公益电子票据服务已于今年2月上线,目前中华社会救助基金会、中国听力医学发展基金会已申请使用该服务。
中华社会救助基金会相关负责人表示,该基金会2022年开票量超过1万张,电子开票可以节约0.5个财务人力成本。
从直播体验升级到公益票据服务,火山引擎通过数据驱动,努力在不同行业的不同业务场景中落地数字化应用。
火山引擎所处的云计算领域是大市场,专业机构估算,国内云计算市场规模预计在今年突破3000亿元。
但,“多云多模型”时代逐步变为现实,企业对云服务的差异化能力提出更高要求,并且需要将云计算与大模型赋能到实际业务中,带来整体业务升级。
行业正在起变化,云计算企业“不得不变”。
在海外,亚马逊AWS于日前为企业客户推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型等。
在国内,云计算领域竞争激烈,阿里云、华为云等均在行业内深耕多年,火山引擎作为“后发之人”,依托于字节生态“溢出”的2B能力,持续升级企业数字化解决方案。
当然,为适应“多云多模型”时代,为大模型客户提供AI基础设施,火山引擎有着“任重道远”的目标。好在,基于多年的资源储备和场景实践,火山引擎已经摸索出了一条自己的云增长道路。