首页 > 财经资讯 >

中海基金姚晨曦:算力与数据并重(今日财经:#大模型门槛高企#解读)

财经资讯 2023-04-13 08:46:38
中海基金姚晨曦在节目中表示,数据主要影响模型训练的效果,在专业数据方面有门槛;训练和推理阶段都需要大量的算力,在服务器的...更多知识由小编为你整理了《中海基金姚晨曦:算力与数据并重》详细内容,欢迎关注学习。

中海基金姚晨曦:算力与数据并重(今日财经:#大模型门槛高企#解读)


中海基金姚晨曦:算力与数据并重

中海基金姚晨曦在节目中表示,数据主要影响模型训练的效果,在专业数据方面有门槛;训练和推理阶段都需要大量的算力,在服务器的投入上有基础门槛。

以下为文字精华:

姚晨曦:ChatGPT发展的背后有大量的数据还有算力的推动,数据和算力都比较重要。

数据主要是影响模型训练阶段的效果,当然目前更多还是通过一些通用的数据去做训练,这些数据相对来说是公开可得的。比如说像一些知识类的数据,大家基本上都会问大英百科全书的数据,但是数据质量可能会有一些高低,比如说大家觉得英语类的数据质量会更高一些,像一些搜索引擎公司,它的数据背后还有用户搜索点击访问的跟踪。所以它可以从中筛选出来更高质量的一些数据,去给模型做训练,提高模型训练的效率,节省前期的一些算力的成本。

如果模型需要在一些专业化的垂直领域去做应用的话,其实你还需要用这些行业的一些数据去做二次训练,这里面很多数据可能相对来说就不是那么好,可能只有行业垂直领域的一些公司才拥有,像法律医学这些比较专业的领域,就会有数据的门槛。

算力对大模型来说是非常重要的,目前大模型更多还是靠提高参数,大力出击的方式来实现人工智能的质变,对于算力的要求是非常高的。这里面分成两个阶段,第一个是模型的训练阶段,这个时候就需要有足够的算力去做保证。

目前来看,可能至少要小几百台AI服务器的数据中心才能实现训练,现在大模型的训练主要基于海外开源的算法,这些算法更多还是基于英伟达的GPU去做调试和优化,需要使用英伟达的AI服务器,成本就很高。可能现在单台的AI服务器就要约20多万美元,如果搭建小几百台的话,基本上投资规模接近10亿人民币,这是基础门槛,可能也不是很多公司能够承受的。

在后期的推理阶段,还需要大量的算力,这个跟用户的访问使用量直接相关,访问使用量越大,算力需求就更大,需求量其实是没有上限的。即便是像OpenAI和微软,基于微软的运营算力,目前算力也是有限的,所以在用户的访问上面,也需要设置访问量的限制,最近我们可以看到,GPT的访问经常出现宕机的情况,也是因为算力遭遇了阶段性的不足。

更重要的是,算力本身的成本是非常重要的,当整个大模型真正进入商业化的运营和落地阶段,这个时候就必须要考虑商业成本的问题,它的单次访问成本和使用成本,能不能通过你的商业模式去覆盖。所以这个方面我们可能还得指望摩尔定律发挥作用,让算力成本可以不断下降。


【内容声明】文章内容由新财梯网编辑整理,新闻来源:东方财富网

中海基金姚晨曦:算力与数据并重相关拓展阅读

中海基金姚晨曦:算力与数据并重(今日财经:#大模型门槛高企#解读)

中海基金姚晨曦在节目中表示,数据主要影响模型训练的效果,在专业数据方面有门槛;训练和推理阶段都需要大量的算力,在服务器的投入上有基础门槛。 以下为文字精华: 姚...


以上就是好财梯网整理的关于中海基金姚晨曦:算力与数据并重(今日财经:#大模型门槛高企#解读)的全部内容,希望你在了解【今日财经:#大模型门槛高企#解读】的基础上可以帮助到你,让我们一起学习理财知识。

标签: 中海基金姚晨曦:算力与数据并重

理财有风险,投资需谨慎。
Copyright © 2016-2020 ok24k.com All Rights Reserved. 皖ICP备2022016496号-9