清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

​清华大学举办的一场机器人版猫捉老鼠游戏,登上了Science子刊封面。

这里的汤姆猫有了新的名字:“天机猫”,它搭载了清华大学类脑芯片的最新研究成果 ——一款名为TianjicX的28nm神经形态计算芯片。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

它的任务是抓住一只随机奔跑的电子老鼠:在复杂的动态环境下,各种障碍被随机地、动态地放置在不同的位置,“天机猫”需要通过视觉识别、声音跟踪或两者结合的方式来追踪老鼠,然后在不与障碍物碰撞的情况下向老鼠移动,最终追上它。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

在此过程中,“天机猫”需要实现实时场景下的语音识别、声源定位、目标检测、避障和决策,而TianjicX能够以节能的方式同时运行跨计算范式的多种 AI 算法,并处理多种机器人协调方式;在相同的任务下,TianjicX的功耗比英伟达AI 芯片的低一半,跑多个网络的延迟大幅降低了79.09倍!

“人工智能领域的重要里程碑”再获突破

2019年8月,清华大学施路平教授团队研发了全球首款类脑计算芯片“天机(Tianjic)芯” ,登上了Nature封面,还被Nature总编斯基珀博士赞誉为“人工智能领域的重要里程碑”!

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

当时,搭载了“天机芯”的自行车实现了真正的自行,能自主控制平衡、避障,识别语音指令、探测前方行人。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

那是中国芯片第一次登上Nature,也成为了2019年科学界的年度热点研究之一。

而这次,清华大学团队在之前的基础上研发出了TianjicX 芯片,支持计算资源的自适应分配和每项任务的执行时间调度,解决了目前移动智能机器人计算硬件研发的难题。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

说到难题,使用神经网络(NN)算法让机器人智能化的道路已经走了很久,但既要实现多种NN的并发执行,又要延迟低、效率高,还得能异步执行、灵活交互,这恐怕目前还没有人能做到。

克服神经拟态芯片关键挑战

所谓神经形态计算芯片,就是模仿人类的神经系统计算框架、计算模式的芯片,它基于分散的非-冯诺依曼架构,可以同时执行多个神经网络模型。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

然而,一般的神经形态芯片通常使用空间切片以流水线方式预配置内核并处理神经网络,每次都要重复执行预先配置的操作,这种固有瓶颈阻碍了现有计算硬件在本地实现多个密集型算法,无法实现低延迟、高效率。

因此,TianjicX 芯片的研发就面临了两个关键挑战:

一是要满足延迟‑并发‑功率  (LCP)  的性能要求,特别是对于各种神经网络的实现;

二是保持每个任务的独立执行不受干扰,同时为任务间交互提供支持。

为了克服这些挑战,研发人员从架构、芯片和模型部署等不同层面进行了一系列设计。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

1.基础架构—— Rivulet执行模型​

在该模型中,每个空间单元都有其内存和控制器用于计算,将神经网络和SNN统一为“静态数据”和“动态数据”,静态数据固定在相应的内存中,动态数据则在相邻的执行单元之间流动。

这使Rivulet成为了机器人算力要求和硬件实现之间的一座桥梁,通过静态数据的分发和动态数据的流化,抽象化了神经网络任务的执行,采用时间和空间切片实现对每个活动进行弹性资源分配,并进行可配置的混合同步异步分组。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

2.芯片的硬件​

以Rivulet模型为基础,清华研究人员设计并制作了基于28nm制程的互补金属氧化物半导体(CMOS)的TianjicX芯片。它集成了160个可配置的交叉计算范式内核(FCore),具有海量并行计算单元、丰富的片上内存以及每个内核可任意配置的原语序列。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

控制器仅占FCore面积的1%左右,但显着提高了任务执行和交互的灵活性和效率。核心内存模块由五个静态随机存取内存  (SRAM)  块组成,总容量为  144  KB。通过高位宽并行读写访问接口,整个芯片在400MHz时可以拥有高达5.12TB/s的内存访问带宽,由于优化了片上内存利用率,实现了单位面积计算能力高达0.2  TOPS/mm2 。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

为了自动生成快速、适当的策略,编译器堆栈采用时空映射方法,统一了各种神经网络以满足硬件功能约束,包括原始变换和量化,能根据不同场景的实际需要,灵活配置多个任务。

3.显著提高机器人性能​

为了展示TianjicX的能力,研究人员将4个TianjicX阵列部署在了多智能任务移动机器人中,并配备了多模态传感器,每个芯片可以单独激活,而在猫捉老鼠的实验中,天机猫仅激活了一个TianjicX。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

在复杂动态的环境中,天机猫展示了在使用极少能量的情况下,利用多种神经网络算法来完成实时场景中的语音识别、声源定位、物体检测、避障和决策。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

检测特定物体:

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

在昏暗室内追逐老鼠:

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

具有多个障碍物的复杂环境:

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

未来,进一步探索更多可能

TianjicX为移动智能机器人计算硬件的研发开辟了一条新的道路,对于大多数商业化的机器人,通常在仓库或工厂中遵循可预测的例程运作,对于更复杂的场景中也会依赖于人类的远程操纵,或者必须与远程数据中心保持无线连接。

TianjicX芯片展现出的强大能力,不仅可以用于提高机器人的智能水平,还可以为替代计算架构设计方法提供思路。“对于机器人来说,这种能力非常重要,可以让自主系统在难以到达的环境中自动运行更长时间”,加州大学Irvine分校的Jeffrey Krichmar对此表示。

清华大学类脑芯片天机芯X登Science子刊封面,机器人版猫捉老鼠上演

论文的结尾,作者写到:“未来,我们将继续研究神经形态计算硬件与机器人计算的结合,探索更多无人机器人的可能性。”

论文标题:Neuromorphic computing chip with spatiotemporal elasticity for multi-intelligent-tasking robots

DOI: 10.1126/scirobotics.abk2948​

© 版权声明

相关文章