打通云-边-端生态闭环 寒武纪发布边缘AI芯片
21世纪经济报道 21财经APP
2019-11-15

11月14日,寒武纪在第21届高交会发布了边缘AI系列产品思元220(MLU220)芯片及M.2加速卡产品。

这也是继此前先后发布端侧、云端平台后,寒武纪对于边缘计算端的能力补充。寒武纪副总裁刘道福向21世纪经济报道记者表示,寒武纪的边缘芯片生态不是割裂的,而是整个寒武纪云-边-端,以及端云一体大生态战略中的一环。

“寒武纪无论是云端、终端,还是边缘芯片,都采用统一的处理器架构和指令集,以及统一的软件栈。这三个领域的生态可以相互促进,形成正循环。”他进一步解释道。

自此,寒武纪初步完成了面向5G时代完整云-边-端的AI芯片矩阵布局。

 

构建智能计算生态

 

据介绍,此次发布的思元220是一款专门用于深度学习的边缘加速芯片,采用台积电16nm工艺,算力最大可达32TOPS(INT4)或16TOPS(INT8),功耗仅10W。

在今年6月,寒武纪发布了中文品牌“思元”及第二代云端芯片思元270,并于去年正式推出云端AI芯片品牌“MLU”(Machine Learning Unit)及第一代云端芯片思元100。

刘道福告诉记者,从算力角度可以将人工智能计算分为终端、云端和边缘端。终端的形态为各类IoT设备、智能摄像头,典型算力要求为1-4Tops;云端典型算力要求为上百Tops以上;而边缘端市场的特点是,即要求高算力,也要求低功耗。

“一方面,边缘计算受限于供电或者工作环境,对于功耗往往比较严苛;另一方面,边缘计算的设备对设备尺寸也比较敏感,因此对于人工智能芯片和板卡的尺寸也有要求。相比之下,云端和数据中心更关注高性能和单芯片的算力,但边缘端要求会更加丰富。这对处理器架构、芯片低功耗设计都是很大的挑战。”他向21世纪经济报道记者分析道。

此外,边缘端由于会汇聚多路数据,需要更强大算力的场景,但目前市面上8-30Tops范围算力的芯片却非常少。寒武纪就是瞄准这个市场,设计了思元220。

至于如何构建寒武纪的边缘计算生态,刘道福进一步指出,寒武纪的云端提供了完整的开发、调试、调优的软件,云端开发好的程序,可以方便快速地部署到终端和边缘,解决这两端开发难、调试难、调优难的问题。而终端和边缘可以积累大量的客户和开发者,反哺于云端生态,最终实现云-边-端生态的繁荣。

在“端云一体”的产品布局策略下,寒武纪在终端和云端的AI芯片共享同样的软件接口和生态,称为Cambricon Neuware。

具体到思元220上,受益于寒武纪两代云端板卡成熟的软件栈,相比竞争对手,用户会更早拿到成熟的软件,更容易进行开发,从而更快实现落地。

“我们正筹划通过和社区以及校园合作,推广我们的产品和生态。”据刘道福表示,在未来,寒武纪将基于客户的终端产品以及公司自有的云端产品,通过和高校共建联合实验室、推动各类比赛等推广活动,和客户一起铺开端云一体的生态。

 

AI的未来走向何方?

 

面向AI发展的未来,刘道福认为,在AI芯片架构创新方面,除了早期的处理器架构创新,更多创新会转向工程技术,包括先进工艺、先进封装,比如2.5D、3D封装,以及chiplet等。另外,软硬件协同设计,高效的编译器技术对于整个AI芯片的落地也非常重要。

在生态构建方面,开放和标准化是非常重要的因素,当前人工智能框架层面已经很开放,并且形成了一些事实标准。而人工智能芯片当前的状态,却不如软件那么开放和标准化,因此,未来人工智能芯片评测标准,乃至指令的开放和标准化,会是一个值得关注的方向。

对于目前国内热切关注的开源指令集架构RISC-V,刘道福回应记者表示,寒武纪对于RISC-V的开放表示欣赏,也认为其在IoT等领域存在一定的发展空间。寒武纪对CPU伙伴一向采取开放合作的态度,也一直在关注RISC-V的发展动态。

具体到落地应用来看,刘道福指出,AI芯片的进一步普及需要大众化,在产业和消费升级的大背景下,AI芯片不仅要做出更低成本、更低功耗,还需提供更高算力,只有兼具这三项优势的AI芯片才能在未来的市场上持续生存。

“因此寒武纪的技术路线是人工智能领域通用处理器路线,以减少客户的开发成本,无需为不同应用学习或迁移不同的平台,从而让寒武纪人工智能处理器通用、好用。”他指出。