关注我们
QRcode 邮件联系 新浪微博
首页 > 科技 » 正文

Arm就是这样,在这场人工智能加速器热潮中

 Chris Williams

这些公告触及了一系列话题,其中一些从营销中显而易见,另一些则不是.

以下是我们认为的主要结论.

分析臂本周宣布推出新的高端CPU和GPU设计,为笔记本电脑、智能手机和类似的个人电子产品的系统芯片制造做准备.

预计至少到2024年底,这些内核将为下一代安卓手机提供动力.

ARM宣布推出位ARMv9.

2 Cortex-A925CPU内核,接替去年推出的Cortex-X4.

X925的时钟频率可以达到3.

8 GHz,可以瞄准3 nm的处理节点,根据ARM的说法,在一个公平的竞争环境中,执行指令的速度至少比X4快15%.

我们被告知,CPU有各种架构上的改进,比如L1指令和数据缓存带宽翻了一番,指令窗口大小翻了一番,预取和分支预测更好-这是性能的关键驱动因素-以及更广泛的微体系结构(例如,四条加载流水线而不是三条,整数乘法执行增加了一倍,以及SIMD/FP发布队列增加了一倍).

所有让CPU设计者感到兴奋的东西.

对于用户来说,关键是ARM相信使用X925的设备在实际使用中将比去年的硬件获得36%的峰值单核性能提升,下降到大约30%的混合工作负载的平均性能提升.

X925的目的是成为未来设备中主要的强大的应用核心或更大的核心.

LITTLE CPU集群,总共最多14个核心.

如何配置该集群取决于从ARM获得这项技术许可证的片上系统设计师.

群集中的其他CPU核心可以是新的中端Cortex-A725和更小、更高效的A520.

X925可以有高达3MB的专用二级缓存,而A725可以有1MB的二级缓存.

我们被告知,集群管理系统也进行了调整,以提供节能.

然后是新的不朽-G925 GPU,芯片设计者可以授权并添加到他们的处理器中.

14核G720集群的性能应该比12核G720的前身大约30%或更高.

据说,GPU及其驱动程序已经过优化,以促进游戏和图形应用程序中的机器学习任务,特别是那些使用Unity构建的应用程序.

据ARM称,G925具有一些有趣的硬件级加速,可以减少基于CPU的渲染线程需要完成的工作量.

这包括GPU内对象分类,避免在屏幕上绘制隐藏的东西,以及同样更好的隐藏表面去除.

这应该会提高性能并减少能源消耗,这对电池供电的设备是有利的.

它还对硬件光线跟踪进行了优化,在一个集群中支持多达24个GPU内核,并改进了分层和作业调度,以利用增加的GPU内核.

总而言之,ARM推出了更多ARM CPU和GPU内核,并一如既往地承诺提高性能和效率,这意味着下一批Android手机将运行得更快,而且不会消耗太多电池.

我们将等待实际硬件的独立审查和基准测试.

通常,芯片上系统设计者会授权ARM的核心和其他部件集成到他们的处理器中.

然后,在进行了几轮测试、验证和优化后,这些芯片设计者将最终布局交给工厂制造并投入设备中.

去年,ARM开始提供其核心的预焙设计--物理实现--这些核心已经通过了选定的FAB的优化和验证.

这些设计作为数据中心级处理器的Neoverse计算子系统提供.

这是为服务器芯片设计者提供了一种在制造高性能组件方面快速起步的方法.

本文标签:
将云数据库与实际工作负载需求相匹配
中国承建的科威特最大炼油厂已正式全面投入运营。