是时候采用新的计算架构方法了吗?
注册表:如果我们看看当今计算架构的工作方式,这个模型的挑战和缺点是什么?赞助特写阅读注册专访,了解苏黎世理工学院的Onur Mutlu教授对我们应该部署的计算架构的看法,以满足下一代需求.
Onur Mutlu教授:我们今天设计计算系统的方式存在重大问题.
其中最大的一个是,尽管数据集在增长,我们正在尝试用它们做更复杂的事情,但进行实际计算的组件在系统中只占很小的一部分.
如果以一个典型节点为例,超过98%的节点专门用于存储、控制和移动数据,而对数据进行操作的处理器只占其中非常小的一部分.
我们设计系统的方式非常以处理器为中心.
处理器是王,所有的东西都必须移到处理器上,这样你才能进行计算.
存储系统、存储系统和互连并不是有效的组件,它们可以高效地进行计算.
当你不断地在处理器和内存或存储子系统之间移动数据时,这是一个主要的瓶颈.
REG:这如何适应数据密集型应用程序的时代?OM:越来越多的情况是,我们有来自机器学习和基因组学等应用程序的数TB数据要存储.
我们和谷歌一起做了一项研究,我们研究了大型机器学习模型,这些模型使用了机器学习加速器,我们发现超过90%的系统总能量实际上花在了访问内存上.
这既会导致能源问题,也会导致性能问题.
硬件的大部分潜力都被浪费了,这也导致了可持续性问题.
所有这些只用于存储数据的处理硬件加起来会浪费大量的碳.
雷格:有没有以更好的方式完成这项工作的余地?奥姆:我相信在未来,内存和存储应该、也将更紧密地结合在一起.
它们也将更加活跃,因此,例如,当处理器需要执行工作负载的数据密集型部分时-例如具有数据密集型推理的大型语言模型-它将该功能卸载到内存.
然后,结果被返回给处理器,允许它继续处理其他事情.
有了这个模型,一切都可以更协作地工作,以更高效、更高效的方式解决问题.
REG:哪种应用程序从这种方法中受益最大?OM:我们谈论的是以数据为中心的应用程序,如基因组学,或机器学习的培训和推理.
您可以为每个存储节点分配存储节点,并根据应用程序的需要动态变化.
通过包含数据并在存储系统中进行处理,您可以创建巨大的能效.
今天的计算机并不节能.
如此多的能量被浪费在将数据从内存移动到处理器上,仅仅是为了非常简单的计算.
我称之为数据移动的隐藏成本.
我们正试图改变这一点,例如,通过将加速功能放在存储器端.
REG:告诉我们更多关于你在基因组学方面所做的工作.