24 5 月 2025, 周六

智算集群互连技术:英伟达的垄断与开放标准的崛起

英伟达凭借其GPU和InfiniBand、NVLink等互连技术在智算集群领域占据主导地位,然而其封闭性制约了技术发展和客户选择。为打破这种垄断,业界正积极推动开放标准的建立。

智算集群的互连主要分为Scale Up(节点内GPU互连)和Scale Out(节点间服务器互连)两种。Scale Up领域,英伟达的NVLink技术占据领先地位,但其封闭性使得其他厂商难以参与。为此,AMD等公司联合成立了UALink联盟,推出UALink协议,旨在建立开放的Scale Up互连标准,实现GPU互连的低延迟和高带宽。

Scale Out领域,英伟达主要采用InfiniBand技术,但其封闭性同样受到诟病。超以太网联盟(UEC)应运而生,旨在通过开放的Ultra Ethernet技术来挑战InfiniBand的统治地位。该联盟汇集了众多业界巨头,致力于开发高性能、可互操作的以太网技术,实现大规模AI和HPC网络互联。

新思科技率先推出Ultra Ethernet IP和UALink IP解决方案,支持UEC和UALink协议,为客户提供更开放的选择。AMD也发布了业界首款UEC就绪AI NIC——Pollara 400,并与其他厂商共同推动UALink技术的发展。

UEC和UALink的1.0版本标准预计于2025年第一季度发布。虽然标准尚未完全成熟,但业界已开始积极布局相关技术,一个更加开放的智算集群互连生态正在形成。这不仅有利于促进技术创新,也为国内厂商提供了参与国际竞争的机会。

智算集群互连技术:英伟达的垄断与开放标准的崛起智算集群互连技术:英伟达的垄断与开放标准的崛起智算集群互连技术:英伟达的垄断与开放标准的崛起智算集群互连技术:英伟达的垄断与开放标准的崛起智算集群互连技术:英伟达的垄断与开放标准的崛起

Eberhart

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注