全球人工智慧(AI)与高效能运算(HPC)军备竞赛的白热化,网路基础设施的效率与可靠性成为决定性因素。博通 5 日宣布,乙太网(Ethernet)已确立大型网络解决方案的领先地位,超越曾被看好的 Infiniband。
博通资深副总裁暨核心交换器部门总经理 Ram Velaga 表示,Infiniband 以敏捷性闻名,但却有信任问题。相较之下,乙太网凭藉最高的效率与可靠性,以及快速的故障恢复能力,成为当前全球网路资讯传输的核心,Meta 与亚马逊两大科技巨头更证明乙太网的优越性。
Ram Velaga 指出,三年前 Meta 最大研究项目是 Infiniband,但如今超过 10 万个 GPU 集群全面转向乙太网。同样地,亚马逊 AWS 庞大 GPU 集群也完全採用乙太网,显示乙太网是正确选择。
另外,针对乙太网的发展趋势与创新突破,博通陆续推出了 Tomahawk 6 与 Jericho 4 两款产品,以因应日益成长的 AI 运算需求。首先在 Tomahawk 6 交换机方面,Tomahawk 6 的速度比前一代 Tomahawk 5 提升两倍。它採用台积电先进的 3 奈米製程所打造,具备 100T 的变速器。这对于如果要连接同等数量的 XPU 或 GPU 的需求,使用 50T 变速器就需要三层网路。但是採用 100T 变速器则仅需一层网路。如此,不仅大幅简化了网络结构,减少了电源消耗和光学元件需求。更使得因转换层次的减少、进一步显着降低了延迟,提升了效能。而这些设计,目前正被客户用于建构他们的相关系统。
至于,在 Jericho 4 乙太网交换式路由器方面,因为当今的超大型 AI 集群需要约 200 兆瓦的资料中心来容纳。然而,许多地区难以提供如此庞大的单一数据中心。这 Jericho 4 应运而生就是透过乙太网交换式路由器,能够连结多个分散的资料中心,最远可达 100 公里,使其看起来像一个大型资料中心。
Ram Velaga 强调,Jericho 4 也同样採用台积电的 3 奈米製程,也在用先进的 CoWoS-S 封装技术,内含超过 1,600 平方公厘(mm²)的电路,并结合 HPMS 技术,这使其成为全球最複杂的晶片之一,甚至可能比某些 GPU 的複杂性更高,其深度发挥的 HPMS 技术也令人惊叹。
Ram Velaga 强调,网络是实现分布式计算的关键。博通向 GPU 製造商传达了重要讯息,那就是不应将网路与 GPU 绑定销售。博通认为,如果 GPU 厂商对其产品有信心,就应该允许市场最好的网路自由竞争,让最好的网路胜出,同时也让最好的 GPU 胜出。这种开放竞争的模式,能确保用户拥有更多选择,并透过市场力量推动整个行业的技术创新,而非透过封闭生态来限制竞争。
博通还进一步指出,乙太网已成为当今高性能网路首选。博通透过 Tomahawk 6 和 Jericho 4 等创新产品,不仅提升了网路速度和效率,更解决了大型 AI 集群的扩展性挑战,同时倡导建立一个更为开放、自由竞争的网路生态系统。未来,乙太网将继续是连接全球计算资源,实现万物互联的基石。

微信扫一扫打赏
支付宝扫一扫打赏