英伟达王朝的“软肋”:GPU的三大风险

来源: 澎湃网
2024-06-20 17:24:20

首创证券认为,英伟达正面临三大风险:AI竞赛放缓、三星投资GPU、算法技术突变。这些风险可能动摇其市值龙头地位,对整个GPU行业造成影响。

6月18日全球GPU龙头英伟达成为全球市值最大的公司

人工智能对GPU算力需求,是GPU的最大推动力

以英伟达为例,足见算力对GPU的拉动力。2024年Q1收入占比高达86.6%的数据中心业务,收入增长426%达到225亿美元。而在2016年英伟达的数据中心业务收入占比仅有6.77%。

拐点一:AI竞赛放缓,大模型创业公司倒闭退出

拐点二:三星投资GPU,新竞争者加入拉低行业利润率

行业龙头英伟达24Q1毛利率高达78.35%,净利润率57%,高利润率容易吸引更多的竞争者加入。三星公开宣布投资GPU,预示着与GPU行业巨头英伟达正面竞争。与谷歌等互联网大厂以fabless模式做GPU不同,三星做GPU有经验与技术积累:1.三星的半导体业务是IDM模式,设计与工艺紧密融合。2.三星拥有Exynos等处理器的成功经验,为GPU提供算力芯片设计参考。3.三星具有与GPU配套的高带宽内存芯片(HBM),可以从系统层面提升芯片算力组的能力。

拐点三:算法层的突变,从矩阵计算到无矩阵计算

通过算法的改进,减少对GPU的消耗,是技术层面的重大风险。前面两大风险都是中短期对GPU公司业绩的影响,是在原有的技术框架下的竞争。而算法技术层面的突变是较大的变革,如同从燃油车到电动车,对汽油的需求直接清零。矩阵乘法(MatMul)是Transformer大语言模型(LLM)中最耗费计算资源的运算,矩阵乘法占用了高昂的计算成本和庞大的内存需求。2024年6月18日arXiv的论文《ScalableMatMul-freeLanguageModeling》(第五版)中的新Transformer架构通过无矩阵乘法(MatMul-free),显著减少对GPU和内存依赖,并且使用FPGA方案替代GPU进行训练和推理,以13瓦特的功耗处理数十亿参数模型,已接近人脑效率。

本文作者:何立 中(SAC执证编号:S0110522110002),来源:首创证券,原文标题:《GPU的拐点》

责任编辑:郭明煜

  当地警方表示,美国俄亥俄州克利夫兰市1月13日晚发生一起枪击事件,造成3人死亡,另有2人受伤。死者中包括一名十几岁的男孩,两名伤者情况危急,已被送往医院。

  纱线材质不同。欧洲缂织所用的纱线相对较粗,织物面积较大,常见的有纵3米、横5米的超大规格,一般作为宫廷殿堂的墙壁装饰,气势宏大,能够很好表达油画强烈的视觉冲击感,适合有距离的欣赏。中国缂丝因丝线本身纤细且强韧,可织作非常细腻的画面,尺幅相对较小,精工细作,即便是放在眼前欣赏也会觉得精美雅致,常见团扇、册页、立轴等书画样式。

  “疫情防控期间,上海自贸试验区管委会陆家嘴管理局和银行合作伙伴迅速调整相关规定,简化流程,特事特办,帮我们解决了很多困难。”以色列BIE集团相关负责人伊万表示,中国打造更好营商环境的努力是实实在在的。集团能够在疫情特殊条件下继续推进业务,得到了来自中国各方面的大力支持。

  喻国明表示,基于大数据的算法推送对于用户需求的掌握更精准、更动态,结合用户反馈,不断优化内容推送,在某种程度上,算法比过去经验型的内容推荐更加升维。

  <a target='_blank' href='/'>中新社</a>记者 郭军

  从资金来源看,有的党员领导干部利用自有资金,有的则“空手套白狼”,先从银行获取低息贷款或向管理服务对象无息或低息借款,再利用职权或职务影响将资金高息转贷给管理服务对象。比如,江西省抚州市人民政府原党组成员、副市长,市公安局原党委书记、局长罗富杨通过银行贷款等方式筹措资金,再向管理服务对象陈某某等人高息放贷,违规获利650余万元。

刘盈甄

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有