阿里大幅增持小鹏汽车。 当地时间11月14日,阿里巴巴向美国证监会提交的13F文件显示,三季度,阿里巴巴大幅增持了小鹏汽车ADS,同时减持了少量玩美股份。阿里增......
2024-11-17 172
中海基金姚晨曦在节目中表示,数据主要影响模型训练的效果,在专业数据方面有门槛;训练和推理阶段都需要大量的算力,在服务器的投入上有基础门槛。
以下为文字精华:
姚晨曦:ChatGPT发展的背后有大量的数据还有算力的推动,数据和算力都比较重要。
数据主要是影响模型训练阶段的效果,当然目前更多还是通过一些通用的数据去做训练,这些数据相对来说是公开可得的。比如说像一些知识类的数据,大家基本上都会问大英百科全书的数据,但是数据质量可能会有一些高低,比如说大家觉得英语类的数据质量会更高一些,像一些搜索引擎公司,它的数据背后还有用户搜索点击访问的跟踪。所以它可以从中筛选出来更高质量的一些数据,去给模型做训练,提高模型训练的效率,节省前期的一些算力的成本。
如果模型需要在一些专业化的垂直领域去做应用的话,其实你还需要用这些行业的一些数据去做二次训练,这里面很多数据可能相对来说就不是那么好,可能只有行业垂直领域的一些公司才拥有,像法律医学这些比较专业的领域,就会有数据的门槛。
算力对大模型来说是非常重要的,目前大模型更多还是靠提高参数,大力出击的方式来实现人工智能的质变,对于算力的要求是非常高的。这里面分成两个阶段,第一个是模型的训练阶段,这个时候就需要有足够的算力去做保证。
目前来看,可能至少要小几百台AI服务器的数据中心才能实现训练,现在大模型的训练主要基于海外开源的算法,这些算法更多还是基于英伟达的GPU去做调试和优化,需要使用英伟达的AI服务器,成本就很高。可能现在单台的AI服务器就要约20多万美元,如果搭建小几百台的话,基本上投资规模接近10亿人民币,这是基础门槛,可能也不是很多公司能够承受的。
在后期的推理阶段,还需要大量的算力,这个跟用户的访问使用量直接相关,访问使用量越大,算力需求就更大,需求量其实是没有上限的。即便是像OpenAI和微软,基于微软的运营算力,目前算力也是有限的,所以在用户的访问上面,也需要设置访问量的限制,最近我们可以看到,GPT的访问经常出现宕机的情况,也是因为算力遭遇了阶段性的不足。
更重要的是,算力本身的成本是非常重要的,当整个大模型真正进入商业化的运营和落地阶段,这个时候就必须要考虑商业成本的问题,它的单次访问成本和使用成本,能不能通过你的商业模式去覆盖。所以这个方面我们可能还得指望摩尔定律发挥作用,让算力成本可以不断下降。
【内容声明】文章内容由新财梯网编辑整理,新闻来源:东方财富网
中海基金姚晨曦在节目中表示,数据主要影响模型训练的效果,在专业数据方面有门槛;训练和推理阶段都需要大量的算力,在服务器的投入上有基础门槛。 以下为文字精华: 姚...
以上就是好财梯网整理的关于中海基金姚晨曦:算力与数据并重(今日财经:#大模型门槛高企#解读)的全部内容,希望你在了解【今日财经:#大模型门槛高企#解读】的基础上可以帮助到你,让我们一起学习理财知识。
标签: 中海基金姚晨曦:算力与数据并重
相关文章
阿里大幅增持小鹏汽车。 当地时间11月14日,阿里巴巴向美国证监会提交的13F文件显示,三季度,阿里巴巴大幅增持了小鹏汽车ADS,同时减持了少量玩美股份。阿里增......
2024-11-17 172
今日哔哩哔哩-W(09626.HK)公布三季业绩,季度首次实现盈利。股价却出现大跌,盘中一度跌超13%。截至发稿,跌10.59%,报145.20港元。从上图走势......
2024-11-17 518
截至本周五,美股多数机构投资者已经完成了第三季度持仓数据(13F)的披露。而对于国内投资者们来说,高瓴、高毅等中资私募机构的海外投资动向无疑是最为关注的。注:四......
2024-11-17 253
上证报中国证券网讯 11月16日,TCL科技首席技术官、TCL华星首席技术官闫晓林在2024年TCL华星全球显示生态大会(DTC2024)上宣布印刷OLED正式......
2024-11-17 671
证券时报e公司讯,思泉新材(301489)近日接受机构调研时表示,北美大客户是公司重要客户,目前该客户订单充足。公司向该客户提供的产品主要为石墨膜,仅应用于其手......
2024-11-17 231