如今,移动设备上出现了越来越多包括生成式AI在内的智能技术,以满足人们在手游影音,以及广大移动应用上获得更好的体验,但同步带来的比以往更大,甚至更加复杂的计算需求。
(资料图)
Arm自去年推出2022全面计算解决方案以来,已经为一系列的工作负载提供了更高的计算性能和能效,并在多个设备中实现了全面计算战略的所有要素。包括基于Arm 2022全面计算解决方案的高通第二代骁龙8移动平台,实现了高阶连接计算的新水平,并为包括三星、小米、一加、vivo、华硕和红魔等众多品牌的创新智能手机提供动力等等。
但这还远远不够,移动数据使用量仍在持续攀升,为了满足定义未来计算的复杂需求,并确保数百万开发者能够轻松地在Arm架构的平台上无缝开发。近日,Arm宣布推出2023全面计算解决方案(TCS23),该解决方案提供一整套针对特定工作负载而设计与优化的最新IP,可作为一个完整系统无缝地协同工作,从而满足日益增长的移动用户体验需求。
Arm高级副总裁兼终端事业部总经理Chris Bergey(右)与Arm中国区业务全球副总裁邹挺(左)共同发布Arm 2023全面计算解决方案
旗舰级Immortalis-G720:采用第五代GPU架构
据Arm中国区业务全球副总裁邹挺介绍,Arm 2023全面计算解决方案在设计时充分考虑了智能手机的需求,它涵盖了首屈一指的全新旗舰级Arm Immortalis GPU,采用了全新的第五代GPU架构。
该架构是Arm迄今为止最高效的GPU架构,重新定义了部分图形管道,以优化内存带宽,让总体系统效率与功耗优化高达14%,从而在移动设备上支持高几何负载的下一代游戏和实时3D应用,同时带来更顺畅、并与PC端和游戏主机媲美的游戏体验。
“Arm全新的GPU架构使下一代游戏和实时3D应用成为可能,让游戏体验更顺畅,并让复杂的PC端和游戏主机体验在移动设备上实现。现在,游戏玩家喜欢的游戏可以通过更高帧率和经优化的高动态范围成像技术HDR运行,带来更逼真的体验感,此外建筑师可以在现场直接通过建筑物实时3D效果图将计算机辅助设计CAD规划变为现实。”
邹挺进一步介绍了基于该架构打造的全新旗舰级GPU——Immortalis-G720,专为旗舰智能手机而设计,可带来15%的性能提升,面积仅仅增加了2%,还减少了多达40%的内存带宽用量,有助于实现更出色且持久的帧率,最终带来更高质量的图形,实现更扣人心弦的视觉感受。
全新Armv9 CPU集群:连续三年性能提升
TCS23还提供了全新的Armv9 Cortex CPU计算集群,该集群已连续三年实现两位数的性能提升。 “新的Cortex-X4是我们的第四代X内核 ,切实彰显了我们对于不断深挖旗舰智能手机性能潜力的坚定承诺。”邹挺表示,Cortex-X4与Cortex-X3相比,性能提高了15%,并带来了一个可以显著降低功耗多达40%的高能效微架构,而面积仅增加了10%。毫无疑问,这是Cortex-X系列处理器中,在每平方毫米的性能方面最出类拔萃的产品。
据介绍,Arm领先的CPU性能也扩展至其全新大小核,即Arm Cortex-A720和Cortex-A520。Cortex-A720是业界主流CPU IP,作为新CPU集群的核心主力,可提高持续性能。Cortex-A520则是Arm目前最出色的高效率核心。这些全新的CPU设计较前几代产品实现了20%的能效提升,可惠及包括AAA级游戏、全天候生产力和后台任务等用例。
为了完善全新的CPU集群,Arm还推出了全新DSU-120 ,专为满足要求苛刻的多线程使用场景而设计,支持从可穿戴设备到智能手机、笔记本电脑的众多设备,使新的CPU集群臻于完善。
此外,在新一代CPU设计中,Arm在TSMC N3E制程工艺上顺利完成了业内首个Cortex-X4流片,进一步深化了双方长期合作的伙伴关系。这项合作同时确保了Arm生态系统已做好准备,能在流片完成后,充分发挥Arm处理器技术带来的功耗、性能、面积(PPA)优势。
为全球开发者提供软件和安全解决方案
可以看到,Arm的全面计算战略就是通过一整套针对特定工作负载而设计和优化的IP,这些IP可作为一个完整的系统,无缝地协同工作。Arm始终站在技术前沿,通过不断提升硬件的机器学习功能,让每一位开发者都能充分利用AI和ML工作负载的优势。
目前Arm的开源软件库Arm NN和Arm Compute Library已在安卓平台上面向 Google应用开放,拥有超一亿的日活用户,可支持开发者在Armv9 CPU和Arm GPU上优化ML工作负载的执行。
“我们今天发布的产品也将推动下一代的旗舰智能手机。但我们所关注的不止在下一代设备,我们还着眼于未来。我们对CPU和GPU 产品路线图的承诺更胜以往,在接下来的几年里,我们将在包括Krake GPU和Blackhawk CPU等关键IP上加大投入,以满足合作伙伴对于计算和图形性能的要求。”邹挺如是说道。
值得一提的是,Arm在设计TCS23中的IP时,要求工程团队从一开始就内置可扩展性和灵活性,以便于合作伙伴能够在不同价位点,打造出更高性能、更高能效的计算解决方案。新的CPU集群提供了额外的选项包括Cortex-A720的更小配置、互连中更多的可扩展性等,为5G时代更广泛的用例提供了高性价比、高能效的计算解决方案。
在问答环节,Arm也针对智能手机接下来的发展趋势等提问进行了针对性回答。Arm高级副总裁兼终端事业部总经理Chris Bergey表示:“我认为最明显的是对生成式AI的兴趣。两周前,Google I/O大会重点强调他们考虑把生成式AI引入到安卓生态系统。不久前,微软的Build开发者大会也在谈到把这些引入Windows 11,从而让Windows的用户体验有进一步的提升。所以很明显,生成式AI和大型语言模型绝对是一个新兴领域。”
Chris Bergey进一步表示,Arm也正在通过相关工作以确保AI可以很好地在Arm架构上运行,“我们相信未来将是一个比较混合(hybrid)的环境,大型语言模型在云端运行,但考虑到智能手机或其他计算设备上本地运行 AI 的隐私和能源效率等问题,用户可以更愿意在设备本机上运行较小的模型。”
写在最后
归根结底,TCS23是一个移动计算平台,目的是通过CPU和GPU技术,带来移动领域的创新,为沉浸式游戏体验和智能AI应用提供支持。我们也相信,Arm和合作伙伴将继续深度赋能移动领域,给用户带来更多更好的体验,让未来充满希望和无限可能性。