AMD推出全新第二代Versal系列产品,为AI驱动型嵌入式系统提供端到端加速
AI已无处不在。其中,边缘AI基于流量占用少、时延低、隐私性强等优势,也已被广泛用于交通、医疗、智能零售、智能工厂、智能城市等各行各业。
4月9日,AMD(超威半导体)宣布扩展 AMD Versal™ 自适应片上系统(SoC)产品组合,推出全新第二代Versal AI Edge系列和第二代Versal Prime系列自适应SoC,为AI驱动型嵌入式系统提供端到端加速。
据介绍,第二代Versal系列产品组合中的首批器件以第一代为基础进行构建,具备强大的全新AI引擎,预计每瓦TOPS较之初代Versal AI Edge系列器件提升至多3倍,同时全新高性能集成Arm® CPU预计可提供比第一代Versal AI Edge和Versal Prime系列器件至高10倍的标量算力。
图片来源:AMD
并且,第二代Versal系列器件将预处理、AI 推理与后处理集成于单器件中,能够为AI驱动型嵌入式系统提供端到端加速。此外,其还平衡了性能、功耗、占板面积以及先进的功能安全与信息安全,提供的全新功能与特性支持为汽车、工业、视觉、医疗、广播与专业音视频市场设计高性能边缘优化型产品。
目前,斯巴鲁已成为首批宣布计划部署AMD第二代Versal AI Edge系列的客户之一,为下一代EyeSight ADAS视觉系统提供支持。
为嵌入式系统带来单芯片智能
在过去十余年时间里,数据经历了“野蛮式”增长,以物联网感知为背景的应用程序运行和海量数据处理,叠加智能电动汽车走向中央集成式的电子电气架构,传统的云计算难以完全满足毫秒级响应时间、安全性等高要求。也由此,边缘计算应运而生,并愈发重要。
当然,高要求意味着更大的工作负载,当前边缘AI也面临着更多限制,包括功耗、尺寸、算力、安全与可靠性等多方面。
一般而言,由人工智能驱动的嵌入式系统,首先要对数据进行预处理,包括传感器的融合以及数据的交集;然后通过矢量处理器进行推断;最后再利用高性能的嵌入式CPU进行后处理,这样才可以通过推断的结果做出决策。
图片来源:AMD
AMD自适应与嵌入式计算事业部(AECG)Versal产品营销总监Manuel Uhm强调,在预处理阶段,必须要实现实时处理,这样才可以真正做到整个系统的实时处理。而这就需要可编程逻辑。
“因为可编程逻辑无论是对于传感器还是对于各种类型的接口,都可以非常灵活地去适应,做到真正的实时,同时还可以保证低时延、确定性,甚至可以在现场部署之后,还可以进行升级。”他进一步谈到,在实时AI驱动嵌入式系统当中,三个步骤的算力都必须能够加速,才能够真正实现全系统的实时。
不过,Manuel Uhm指出,当前市面上还没有一类处理器能够针对三个阶段直接完成优化,多数采用多芯片的解决方案,然而这就会对整个嵌入式系统带来一系列问题与限制。比如,更高的功率需求和供电复杂性,更高的占板面积和终端系统尺寸,更高的外部内存需求和芯片间的凸性带来的时延增加,更多的安全漏洞和报废挑战,以及工作效率低下等。
这也是AMD此次推出第二代Versal自适应SoC的原因所在——多个器件叠加运行才能实现的功能,通过单一芯片的智能来解决。同时,实现对第一代产品的补充。
图片来源:AMD
第二代Versal AI Edge系列和第二代Versal Prime系列自适应SoC所拥有的单芯片智能性,消除了构建多芯片处理解决方案的需求,进而带来了更小、更高效的嵌入式AI系统,并为缩短上市时间提供潜能。
根据介绍,该系列器件在预处理阶段采用FPGA可编程逻辑架构用于实时处理,灵活连接各种传感器并实现高吞吐量、低时延数据处理工作流程;在AI推理阶段,则通过矢量处理器阵列构成下一代AI引擎,实现高效AI推理;在后处理阶段,以Arm CPU内核为安全关键型应用提供复杂决策与控制所需的后处理能力。
与此同时,该系列器件还能带来较之初代至高10倍的标量算力。但不可忽视的是,标量算力显著提升的同时,也带来了相应功耗的增长。
据Manuel Uhm透露,第二代的功耗会比一代的VE2302高出很多。但是他也补充,“如果要实现同样的DMIPS,使用一代2302产品的话,就需要使用外部的处理器,由此产生的总功耗实际上还是要高于二代的产品。”
图片来源:AMD
值得一提的是,此次新产品的推出还有一个很大的亮点在于,相较于第一代产品,第二代则主要针对中央计算引擎,而第一代更多的是进行CPU的加速。
当前,汽车行业已经进入到ADAS标配时代,越来越多传感器被集中在一个域控制器内,即中央计算。
沿着这种趋势,AMD推出的第二代Versal产品能够在“汽车大脑”进行数据融合。用官方的话来说,就是第二代Versal AI Edge系列与第二代Versal Prime系列产品组合为AI驱动型系统提供了从边缘传感器到中央计算的可扩展性,支持客户选择性能、功耗以及占板面积,以高效实现应用性能与安全目标。
此外,该产品组合也能简化设计周期。AMD表示,AMD Vivado™ 设计套件工具及库有助于为嵌入式硬件系统开发人员提升生产力并简化设计周期,从而缩短编译时间与提升结果质量。对于嵌入式软件开发人员,AMD Vitis™统一软件平台支持在用户首选的抽象级别进行嵌入式软件、信号处理和AI设计开发,无需具备FPGA经验。
对于AMD而言,其在FPGA领域实力的突破与在数据中心领域大举进攻,很大一部分原因在于,于2022年2月完成对全球FPGA第一大品牌赛灵思(Xilinx)的收购。
彼时,原赛灵思总裁兼CEO,后担任AMD自适应与嵌入式计算事业部(AECG)总裁的Victor Peng认为,“快速发展的连接设备和嵌入式人工智能的数据密集型应用,推动了对高效和自适应高性能计算解决方案需求的不断增长。AMD和赛灵思的结合,将提供非常全面的自适应计算平台组合,为广泛的智能应用提供动力,从而加速我们定义计算新时代的能力。”
图片来源:AMD
AMD在AI时代的动作还在持续加速。目前,AMD第二代Versal产品早期访问文档已经发布。据透露,AMD预计于2025年上半年提供第二代 Versal系列芯片样片,2025年年中提供评估套件及系统模块(SOM)样品,并预计于2025年末提供量产芯片。
“对人工智能化嵌入式应用的需求正呈爆炸式增长,并带动了对能在嵌入式系统的功耗和占板面积限制内实现最高效端到端加速的单芯片解决方案的需求。依托于40余年来自适应计算的领先地位,这些最新一代Versal器件将多个计算引擎集成于一个架构之上,将提供高计算效率与性能以及从低端到高端的可扩展性。”AMD高级副总裁兼自适应和嵌入式计算事业部总经理Salil Raje谈到。