随着最新的AI芯片Blackwell GB200的订单量攀升,英伟达股价也水涨船高。但这场AI盛宴的背后,AI算力市场却呈现出“冰火两重天”的景象。
自英伟达在今年3月发布Blackwell架构GB200芯片以来,这款产品一直备受外界瞩目。最近,天风证券分析师郭明錤在研究报告中表示,英伟达GB200芯片订单量激增,微软是这款芯片最大的客户,其第四季度的订单量增长3-4倍,超过其他所有云服务商的总和.
在新一代AI芯片需求爆发的同时,曾经炙手可热的H100芯片却有些遇冷,在算力租赁市场的价格已由巅峰时期的8美元/小时降至2—3美元/小时。证券时报记者向业内人士了解到,从今年上半年开始,国内算力的价格就呈现下降趋势,在大模型训练需求有所下滑及早期“囤卡”导致供给相对过剩的背景下,一些规模较小的算力供应商或将面临亏损,正加速被市场“洗”出去。
值得注意的是,在AI大模型的浪潮下,多家A股上市公司此前已布局算力服务,其中不乏跨界玩家。在风起云涌的AI浪潮中,算力供给及市场需求情况瞬息万变,相关投资是否能够取得理想的回报,正成为一个越来越不确定的问号。
GB200芯片订单,未来一年已排满
最近,摩根士丹利的分析师与英伟达首席执行官黄仁勋、首席财务官及管理团队的其他成员举行了一场会议。根据会议中得知的消息,分析师Joseph Moore表示,英伟达下一代GPU芯片Blackwell的生产正在“按计划进行”,且未来12个月左右的供应已经售罄。
天风国际证券分析师郭明錤在最新发布的英伟达Blackwell GB200芯片产业链订单信息也显示,Blackwell芯片的产能扩张预计在2024年第四季度初启动,预计2024年第四季度的出货量将在15万到20万块之间,2025年第一季度出货量将显著增长200%到250%,达到50万到55万块。郭明錤还指出,目前微软是英伟达Blackwell GB200芯片的全球最大客户,今年第四季订单量将激增3至4倍,其订单量将超过其他所有云端服务商的总和。
作为英伟达新一代的AI旗舰芯片,Blackwell GB200芯片包含了2080亿个晶体管,采用台积电N4P制程,为双芯片架构,AI算力达20petaFLOPS(FP4),是Hopper的5倍。据国海证券研报,与上一代AI旗舰芯片H100相比,英伟达主打的GB200NVL72服务器可将AI大模型训练速度(如1.8T参数GPT-MoE)提高30倍。
手握高性能的AI芯片,来自各大客户的订单也纷至沓来。黄仁勋曾在CNBC的栏目访谈中提到,微软、OpenAI、Meta等科技公司对Blackwell芯片的需求十分强烈,“每个人都希望拥有最多,也希望成为第一”。
“Blackwell GB200芯片需求爆发,不仅预示着英伟达在AI硬件领域的领先地位进一步巩固,也表明全球AI发展正在加速进入以更高效、更强大计算能力为支撑的新阶段。”天使投资人、资深人工智能专家郭涛在接受证券时报记者采访时表示,GB200若成功量产出货,将对全球AI生态系统产生深远影响,促进复杂模型训练与推理效率的提升,推动人工智能在多个行业的深度应用,加速AI技术的普及和创新步伐。
H100芯片遇冷,租赁价格较高峰期跌超50%
与GB200芯片需求爆发相比,曾经一度炙手可热的上一代旗舰芯片H100在算力租赁市场上却已从“一卡难求”转为“供过于求”。
时间回溯至2023年3月,英伟达推出了H100系列GPU。与再上一代的芯片A100相比,H100基于Hopper架构,拥有18432个CUDA核心,支持更先进的内存技术和更高的带宽,性能提升3倍,尤其在AI训练和推理任务上表现出色,这也使H100一跃成为近两年来最强大、最抢手的GPU产品。
在大模型的狂潮下,GPU的性能很大程度决定了模型训练的效果,因此各大公司都投入了巨额资金抢购H100。证券时报记者从一名做算力资源池的业内人士处了解到,搭载H100的服务器一般是以8卡的形式出售或出租,去年8卡整机的出售价格一般都在300万元以上,如今价格已降至230万元—240万元左右,“一周一个价”。而英伟达对华特供的H20芯片,8卡整机的价格也从之前的140万元左右降至110万元以内。
在算力租赁市场,价格下降的幅度更加明显。据了解,H100芯片最初的租赁价格为4.7美元/小时,在需求巅峰时期一度被爆炒至每小时8美元以上。记者查询算力租赁网站发现,如今1个H100NVL的租赁价格在每小时2—3美元之间,价格比巅峰时期已跌超50%。
“现在算力价格下降得比较厉害,我们也都在观望之中。”该业内人士向记者表示,算力价格下降并非Blackwell GB200芯片推出后才有的现象,他从今年上半年开始就感觉市场的水温在转凉,此前训练大模型的需求很旺盛,加上市面上可用的算力不多,所以大家都在囤货,从而进一步推高了价格。
该业内人士观察认为,如今算力价格趋于下行主要有两方面的原因。一是需求减少,在经历了前期的疯狂投入以后,AI的收益曲线似乎没有人们想象中的那么陡峭,很多公司开始重新审视对AI的投入,投资趋缓;二是算力供给提升,尤其在国产化提速、模型开源的背景下,企业从寻找大规模、高性能的算力,逐渐转向更具性价比、可满足小集群训练或推理任务的芯片。
在价格下行的趋势下,一些业内人士表达了对GPU泡沫破裂的担忧。不过,也有不少从业者认为,这一趋势是技术迭代和市场自我调节的正常表现。郭涛向记者表示,所谓的“GPU泡沫破灭”可能过于悲观,“当前AI算力市场正处于动态平衡中,虽然个别产品价格波动,但整体需求依然强劲。”
上百家上市公司入局算力租赁,盈利问题仍迷雾重重
自生成式AI引爆算力需求后,许多的上市公司进军算力市场,其中算力租赁作为一种更为灵活、更具成本优势的方式,更是成为各路玩家布局的重点赛道。同花顺数据显示,截至10月26日,已有107家上市公司涉及到算力租赁业务,其中既有云服务、数据服务等领域的公司,也不乏地产、建筑材料、纺织服装、印花染料等领域的跨界入局者。
在算力租赁价格下行的背景下,前期在算力方面的资本投入能否取得理想的回报,成为弥漫在所有玩家前方的迷雾。英伟达曾预测,GPU每小时租赁价格将在4年内保持4美元/小时左右的价格,然而如今H100在一年半的时间内,租赁价格就已降至每小时2-3美元,这对于早期大量囤卡的算力租赁商而言,意味着利润的急遽下滑。
根据外媒latent.space作者Eugene Cheah在最近一篇文章中的测算结果,当GPU租赁价格跌破1.65美元/小时,算力提供商就面临严重的亏损风险。Eugene Cheah直言,投资购买新的H100已不再具有收益。事实上,不仅是H100,英伟达另一款热门的消费级芯片4090在今年3月时,租赁价格还普遍在每月1.3万元左右,如今已跌至每月七八千元,相关投资的收回周期将被拉长。
一方面,算力租赁价格具有高度的不确定性;另一方面,算力租赁市场需求也面临较大的波动。在经历了2023年的“百模大战”以后,如今硝烟似乎已淡化,许多公司逐渐放弃预训练模型,缩减预训练投入,更多地从模型训练转向应用,对高性能预训练芯片的需求也逐渐减少。考虑到绝大多数公司近两年才入局算力租赁业务,还处于早期投资阶段,成本还未收回。以上的这些因素,将对算力租赁业务的盈利构成较大的挑战。
另外,由于国际关系等复杂的外部原因,国内厂商能否如期获得高性能算力卡也是一个问题。例如,去年“味精大王”莲花控股宣布入局算力业务。最近,莲花控股发布公告,对转型算力业务相关情况进展进行说明。其中提到,公司全资子公司莲花科创在去年9月与新华三信息签订330台GPU系列服务器采购合同,合同金额为6.93亿元。然而,目前新华三信息除去年11月交付了12台以外,剩余318台尚未交付。公告还提示,剩余318台GPU系列服务器的交付存在不确定性的风险,交付期限存在不明确的风险。
“一方面,算力价格下降压缩了服务提供商的利润空间,增加了运营压力;另一方面,也为更多企业提供了低成本获取高性能算力的机会,促进了AI技术的广泛应用。”郭涛表示,技术更新换代的速度加快会带来投资贬值的问题,对于进入算力业务的公司而言,需要密切关注市场动态,合理规划投资,避免盲目跟风,同时加强技术创新和服务优化,以应对潜在的市场波动和不确定性。