研究透视：AI 推理芯片 | Science

今日新材料今日新材料

自计算机诞生以来，计算过程一直以处理器为中心，存储与计算就是分离的。然而，在记忆内存和计算之间穿梭传输大量数据，会在能耗、处理带宽和速度方面付出高昂的代价。这在新兴的和先进的实时 AI 应用（如脸部识别、物体检测和行为监控等）中，尤其明显，只因这些应用需要快速获取海量数据。

近日，美国 IBM研究实验室（IBM Research）Dharmendra S. Modha，Filipp Akopyan等，在Science上发文，仿生了有机大脑，并优化了无机硅。报道了一种神经推理架构NorthPole，即通过移除片外存储器，将计算与芯片存储器融合在一起，并在外部显示为有源存储芯片，从而模糊了存储与计算的界限。NorthPole是一种低精度、大规模并行、高密度互连、高能效的空间计算架构，具有协同优化、高利用率的编程模型。

在ResNet50基准图像分类网络上，相较于12纳米技术工艺的图形处理器graphics processing unit（GPU），NorthPole实现了每瓦特每秒帧数frames per second （FPS）能量指标高达25倍，每晶体管每秒帧数FPS空间指标高出5倍，以及延迟时间指标低22倍。Yolo-v4检测网络也报告了类似结果。NorthPole性能优于所有流行的架构，甚至是那些使用更先进技术流程的架构。