Arm 全面设计,构建可持续 AI 数据中心
新闻重点:
· Arm 全面设计 (Arm Total Design) 生态项目推出一年来,成员规模翻倍,推动了全球芯片创新
· Arm、三星晶圆代工厂 (Samsung Foundry) 、ADTechnology 和 Rebellions 合作开发基于 Neoverse CSS V3 的 AI CPU 芯粒 (chiplet) 平台,应用于云、高性能计算 (HPC) 以及人工智能/机器学习 (AI/ML) 训练和推理
· 安国国际科技 (Alcor Micro) 和 Alphawave 推出基于台积公司工艺的全新芯粒,用于打造可持续 AI 数据中心
近日,Arm 控股有限公司 (纳斯达克股票代码:ARM,以下简称 Arm) 分享了 Arm 全面设计生态项目推出一周年后的最新动态:参与企业已迅速扩展到近30 家,涵盖了从 IC 设计到晶圆代工服务等各项专业能力,最新加入的企业包括安国国际科技、神盾公司 (Egis)、熵碼科技 (PUFsecurity) 和 SEMIFIVE。此外,通过该生态项目,Arm、三星晶圆代工厂、ADTechnology 和 Rebellions 正在联手向市场推出 AI CPU 芯粒平台,面向云、HPC 以及 AI/ML 训练和推理工作负载。
Arm基础设施事业部营销副总裁 Eddie Ramirez 表示:“随着 AI 算力需求的增长,确保开发者以高性能、低功耗且易用的方式,在全球应用最普及的计算平台上轻松运行创新成果至关重要。Arm 计算子系统 (CSS) 和 Arm 全面设计正助力软硬件的快速进步,推动 AI 开发。我们已迈入工程创意发展的时代,Arm 正提供必要的工具和技术,以推动 AI 和芯片领域的创新。”
全新Arm 架构解决方案推动 AI 数据中心的可持续发展
Arm 全面设计带动了全球合作,促成了多个以 CSS 为核心的生成式 AI 计算解决方案诞生。其中一个绝佳的例子是由 Arm、三星晶圆代工厂、ADTechnology 和 Rebellions联合推出的 AI CPU 芯粒平台。该平台专门针对云、HPC 以及 AI/ML 训练和推理工作负载,结合了Rebellions的 REBEL AI 加速器和搭载 Neoverse CSS V3 的 ADTechnology 计算芯粒,并采用三星晶圆代工厂 2nm 全环绕栅极 (GAA) 先进工艺技术,带来出色的性能和能效,预计可为生成式 AI 工作负载(Llama3.1 405B 参数 LLM)带来2-3倍的能效优势。
三星电子副总裁兼代工业务开发负责人 Taejoong Song 表示:“AI 和 HPC 设计需要采用具有最高性能、高晶体管密度和高能效的技术解决方案。三星晶圆代工厂的 2nm GAA 工艺专为满足严格的 HPC 和 AI 设计要求而设计,我们很高兴能够利用 Arm CSS 的灵活性和 Arm 全面设计的优势来打造 AI CPU 芯粒平台,进一步推动超大规模企业和云服务提供商采用我们的尖端技术和设计解决方案。”
这个合作范例充分体现了 Arm 全面设计和基于标准计算子系统在加速 AI 芯片开发方面的独特价值。通过集成 Arm 优化的 EDA 工具、全球设计专业知识和晶圆代工服务合作关系,Arm为 AI 加速器设计人员简化了集成流程。随着 AI 工作负载的快速演进,紧密耦合 CPU 计算对于支持完整的 AI 堆栈至关重要。数据预处理、编排、数据库增强技术(例如检索增强生成 (RAG)) 等都能受益于 Arm Neoverse CPU 的性能效率。Arm 已经在 CSS 中融入了对这些要求的支持, 并通过Arm 全面设计生态项目从中受益。
专为 AI 基础设施打造的新标准
CSS 和 Arm 全面设计正在帮助打造可持续 AI 数据中心的硬件基础。Arm 全面设计已经在加速开发基于 Arm 架构的测试芯片以及由 Neoverse N 系列或 V 系列 CSS 驱动的芯粒产品。通过提供优先获取最新 CSS 的广泛途径,我们降低了行业准入门槛,打造了从云端到边缘的多样化芯粒解决方案,并加速了开发速度。
近日,Alcor Micro 宣布他们正在构建由 CSS 驱动的芯粒,针对 AI/ML 训练和推理用例。Alphawave 近期也宣布推出基于 CSS 的先进计算芯粒,面向 AI/ML、HPC、数据中心和 5G/6G 应用。这些基于 Arm 架构的芯粒充分展现了 Arm 生态系统独有的多样性、灵活性和全球化。
此外,Arm 全面设计合作伙伴(包括 Alphawave、Cadence 和 proteanTecs 等)正通过 CSS 在先进节点上验证第三方 IP 产品,以确保其符合 Arm 规范和标准。这意味着合作伙伴可以在先进节点上构建基于 CSS 的定制芯片,并获得无缝的开箱即用的软件体验。
这种软件就绪程度始终是释放 AI 潜力的关键。30 多年来,Arm 不断进行资源投入,以确保在 Arm 平台上运行的软件“开机即用”。如今,所有主流框架和操作系统均在 Arm 架构上运行。对于 Arm 全面设计生态项目而言,这意味着 Arm 合作伙伴推向市场的多样化芯片解决方案,都能充分利用同样充满活力且高度整合的软件生态系统。这项持续投入的最新成果之一是 Arm Kleidi 技术的推出,该项技术被集成到 PyTorch 和 Llama.cpp 等开源项目,优化了 Arm 平台上的 CPU 推理。这对于Arm 全面设计合作伙伴来说尤为重要,他们无需依赖专用的加速器,即可通过 CSS为边缘 AI 计算打造芯粒。