首页 > 财经资讯 >

火山引擎发布大模型训练云平台:支持万卡训练(AIoT周看点|燧原发布二代AI推理加速卡和安企凯旺科技拟登陆创业板)

财经资讯 2023-04-19 19:25:06
AI大模型技术应用爆发,云市场也在加速变革。 4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU(中央处理器...更多知识由小编为你整理了《火山引擎发布大模型训练云平台:支持万卡训练》详细内容,欢迎关注学习。

火山引擎发布大模型训练云平台:支持万卡训练(AIoT周看点|燧原发布二代AI推理加速卡和安企凯旺科技拟登陆创业板)


火山引擎发布大模型训练云平台:支持万卡训练

AI大模型技术应用爆发,云市场也在加速变革。

4月18日,火山引擎在其举办的“原动力大会”上发布自研DPU(中央处理器分散处理单元)等系列云产品,并推出新版机器学习平台:支持万卡级大模型训练、微秒级延迟网络,让大模型训练更稳更快。

“国内有数十家做大模型的企业,大多已经在火山引擎云上。”火山引擎总裁谭待认为,大模型不会一家独大。与其他云厂商力推自家大模型不同的是,火山引擎将接入多家大模型深度合作,为企业和消费者提供更丰富的AI应用。

会上,火山引擎宣布与字节跳动国内业务并池。基于内外统一的云原生基础架构,抖音等业务的空闲计算资源可极速调度给火山引擎客户使用,离线业务资源分钟级调度10万核CPU,在线业务资源也可潮汐复用,弹性计算抢占式实例的价格最高可优惠80%以上。

谭待在会后接受采访时表示,成本是云计算的关键竞争力,但成本问题需要通过技术手段可持续地做好,而不是通过短期的商业手段,后者不可持续。

让大模型训练快速跑起来

自2022年底发布以来,ChatGPT成为人类历史上最快获得上亿用户的消费级互联网应用。

谭待表示,国内很多科技公司投入到大模型建设中,他们有优秀的技术团队,也有丰富的行业知识和创新想法,但往往缺乏经过大规模场景实践的系统工程能力。火山引擎要做的就是为大模型客户提供高稳定性和高性价比的AI基础设施。

据悉,火山引擎机器学习平台经过抖音等海量用户业务长期打磨,支持单任务万卡级别的超大规模分布式并行训练场景。GPU弹性计算实例可灵活调度资源,随用随取,最高可以为客户节省70%的算力成本。

字节跳动副总裁杨震原认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。通过潮汐、混部等方式,火山引擎实现资源的高利用率和极低成本。以抖音推荐系统为例,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。火爆全网的抖音“AI绘画”特效,从启动到上线只用一周多时间,模型由一名算法工程师完成训练。

MiniMax是目前国内少数已经推出自研大模型产品的AI技术公司,拥有文本、视觉、声音三种通用大模型引擎能力。据MiniMax联合创始人杨斌介绍,MiniMax与火山引擎合作建立了超大规模实验平台,实现千卡级常态化训练;超大规模推理平台有万卡级算力池,支撑单日过亿次调用。在火山引擎的云上,MiniMax大模型业务实现快速突破。

向“多云多模型”架构演进

有评论称,大模型将成为云厂商弯道超车的机会。谭待对此表示,大模型还在发展初期,面临数据安全、内容安全、隐私保护、版权保护等许多问题需要努力解决。但可以预见,大模型将带动云上AI算力急剧增长,AI算力的工作负载与通用算力的差距会越来越小,这会为各家云厂商带来新的机会,同时也会对数据中心、软硬件栈、PaaS平台带来新的挑战。

数据中心的算力结构为例,谭待表示:“大模型需要大算力,虚拟化会带来资源损耗,规模越大就损耗越多。未来3年内,大规模的算力中心,都将形成‘CPU GPU DPU’的混合算力结构,CPU负责通用计算,GPU负责AI计算,DPU负责资源卸载、加速和隔离,提升资源效率。”

此次原动力大会上,火山引擎发布了新一代自研DPU,实现计算、存储、网络的全组件卸载,释放更多资源给业务负载。火山引擎尽管是“最年轻”的云厂商,其自研DPU已达到业界领先水平,网络性能高达5000万pps转发能力、延迟低至20us。基于自研DPU的各类计算实例性能也有显著提升,例如适用于大模型分布式并行训练场景的GPU实例,相较上一代实例集群性能最高提升3倍以上。

他还表示,在大模型及下游应用发展推动下,无论传统企业还是初创企业,对AI算力都有迫切需求,企业使用多家云服务将成为常态。同时,各行业有自己高质量的私有语料,大模型不会一家独大,而是会在千行百业生长,形成多模型共生甚至协作的生态。

“未来将是‘多云多模型’的时代。”他说。


【内容声明】文章内容由新财梯网编辑整理,新闻来源:21世纪经济报道

火山引擎发布大模型训练云平台:支持万卡训练相关拓展阅读

火山引擎发布大模型训练云平台:支持万卡训练(AIoT周看点|燧原发布二代AI推理加速卡和安企凯旺科技拟登陆创业板)

AIoT周看点|燧原发布二代AI推理加速卡和安企凯旺科技拟登陆创业板

答:微评:和依图 科技 一字之隔,也同属AI企业,不过依瞳 科技 的主打的是AI平台业务,主要提供包括数据源管理、数据标注、数据集存储、数据预处理、模型训练优化、推理部署的AI算法训练及算力资源服务。其面向的业务领域也主要......更多详细

人工智能技术有哪些?

问:人工智能技术有哪些?...更多详细

以上就是好财梯网整理的关于火山引擎发布大模型训练云平台:支持万卡训练(AIoT周看点|燧原发布二代AI推理加速卡和安企凯旺科技拟登陆创业板)的全部内容,希望你在了解【今日财经:#支持万卡训练,集群性能提升3倍#解读】的基础上可以帮助到你,让我们一起学习理财知识。

标签: 火山引擎发布大模型训练云平台:支持万卡训练

理财有风险,投资需谨慎。
Copyright © 2016-2020 ok24k.com All Rights Reserved. 皖ICP备2022016496号-9