
据J.P. Morgan(通过 @Jukanlosreve)透露,英伟达计划于明年推出面向AI与HPC的Vera Rubin平台,这可能会对AI硬件供应链带来重大变化。英伟达计划向合作伙伴提供已完整组装的Level-10(L10)VR200计算托盘,其中所有计算硬件、冷却系统和接口均预先安装。此举将使主要ODM的设计和集成工作大幅减少,降低其工作负担,但也会压缩其利润空间,转而惠及英伟达。目前此信息仍属非官方。
从VR200平台起,英伟达据称正准备接管全套L10计算托盘的生产,这些托盘预装Vera CPU、Rubin GPU以及冷却系统,而不再让超大规模用户和ODM合作伙伴自行构建主板和散热方案。这并非英伟达首次向合作伙伴提供部分集成的服务器子组件在GB200平台时,它曾交付完整的Bianca主板并预装关键组件。然而,当时可视为L7–L8级别的集成,如今回报称公司正考虑一路推进至L10,整托盘的组装——包括加速器、CPU、内存、网卡、供电硬件、中平面接口以及液冷冷板——作为预装、已测试的模块出售。
若上述信息属实,英伟达确实会向合作伙伴发货L10计算托盘(其成本大约占服务器总成本的90%),那么英伟达只会留下机架层面的集成工作,而非服务器设计。合作伙伴仍需自行构建外壳、根据需求集成电源、安装侧车或CDU进行机架级散热、添加自有BMC与管理软件栈,并完成最终装配和测试。这些任务在运营上必不可少,但并未在硬件层面形成实质性的差异化。
此举有望缩短VR200的投产周期,因为英伟达的合作伙伴无需在内部完成全部设计,且可凭借英伟达与EMS(最有可能是富士康作为主要供应商,随后是广达和纬创——虽属推测)的直接合同实现规模化,从而降低生产成本。例如,黄仁勋最近展示的Vera Rubin Superchip板卡采用极其复杂的设计、超厚PCB以及全固态元件。设计此类板卡耗时且成本高昂,交由特定EMS代工制造显得十分合理。
据J.P. Morgan报道,一颗Rubin GPU的功耗已从1.4 kW(Blackwell Ultra)提升至1.8 kW(R200),甚至2.3 kW(此前未公布的TDP,针对未公开的SKU,英伟达对Tom's Hardware的置评请求予以回绝),而更高的散热需求也是转向整托盘供货而非单独组件的动因之一。然而,供应链消息人士透露,包括微软在内的多家OEM、ODM以及超大规模用户正试验极为先进的散热方案,如浸没式和嵌入式冷却,这进一步展示了他们的技术积累。
因此,英伟达的合作伙伴将从系统设计者的角色转变为系统集成、安装及支持提供者。他们仍负责企业功能、服务合同、固件生态及部署物流等工作,但服务器的“核心”——计算引擎——已被英伟达固定、标准化生产,而不再由OEM或ODM自行研发。
此外,人们不禁要猜测,基于Rubin Ultra平台的英伟达Kyber NVL576机架级解决方案将何去何从。该方案计划与800 V数据中心架构同步推出,旨在实现兆瓦级机柜甚至更高规格。目前唯一的问题是,英伟达是否会进一步提升其在供应链中的份额,例如扩展至机架层面的整体集成。
嘉汇优配提示:文章来自网络,不代表本站观点。