高成长企业83丨鲲云科技“换道超车”研发数据流AI芯片 助力多场景数字化改造升级

高成长企业论林典驰 2022-11-07 18:56

人生是场长跑,AI芯片亦是。

南方财经全媒体记者林典驰 深圳报道  人生是场长跑,制胜的关键不是瞬间的爆发力,而是整场比赛的平均速度。AI(人工智能)芯片同理,考验一款AI芯片的优良不仅仅是峰值算力,还有长时间工作下的实测性能。

随着AI日益成熟,数字化正深入各个领域。AI产业链包括三层,其中最底层也是最基础的就是以芯片等硬件为AI提供数据及算力支撑的基础层。

鲲云科技便是国内诸多AI芯片设计厂商中一颗冉冉升起的新星,自成立之初专注AI芯片的研发设计。鲲云科技以数据流技术为核心,提供高性能、低延时、高算力性价比的下一代人工智能计算平台。

6月,鲲云科技凭借CAISA芯片,获得了中国智能科技技术最高奖——吴文俊人工智能专项奖芯片项目一等奖。

鲲云科技联合创始人兼首席技术官蔡权雄在接受南方财经全媒体记者采访时表示,随着摩尔定律逼近物理极限,单纯依靠制程提高芯片性能愈发困难,鲲云的核心技术是采用定制的数据流架构,该架构可以不依赖指令集加速人工智能计算。鲲云科技可基于现有的成熟制程,通过架构创新,提高芯片的使用率,从而大幅降低用户使用人工智能的成本。

另辟蹊径自主研发底层架构

在2015年牛昕宇参加学术论坛后,台下一位天使投资人对其发出创业邀请。彼时他师从数据流架构的开创鼻祖陆永青院士,是英国帝国理工学院的全奖博士和实验室负责人。

那年第一代AI芯片开始爆发,传统芯片厂商、算法公司、互联网巨头鱼贯而入。牛昕宇开始有点犹豫,但在陆永青院士的支持下,2016年他毅然回国创立了鲲云科技。后来,牛昕宇又向师兄蔡权雄抛出橄榄枝,邀请他出任鲲云科技CTO,并从帝国理工学院挖掘了一批创业伙伴。

蔡权雄表示,创业初期最大难点是对AI芯片市场需求的判断,这将其决定技术路线的迭代方向;这才有前期产品一边同客户推广,一边观察市场需求反复打磨的经历。

“做AI芯片有两个方向。一个是基于传统的指令集架构,这条路相对容易,但是在芯片利用率上很难拉开差距。例如国外的AI芯片在算力和制程每一个指标都非常领先,加上国外专利的垄断性,在这种情况下,我们在这条路上想要突出重围,是非常难的。”牛昕宇表示。

鲲云科技基于30余年的技术基础,瞄准数据流架构独立研发。早在求学期间,牛昕宇就已经将数据流底层技术作为主要的研发方向,并致力于推进数据流架构和各个特定应用领域的融合,比如金融、机器学习、物理仿真等。

经过三年打磨,2020年鲲云发布全球首款数据流AI芯片CAISA,搭载了四个CAISA3.0引擎,峰值性能可达10.9TOPs,经第三方检测,该芯片可实现最高95.4%的芯片利用率,并已实现量产。

与X86架构、ARM架构等指令集架构不同,数据流架构的显著特点就是依托数据流的流动次序控制计算执行次序,而非指令执行次序,使用粗粒度表示来提高数据的并行度,并允许编译器同时调度多个顺序循环和功能,以实现更高的吞吐量和更低的延迟。

数据流架构的意义在于突破了传统芯片架构对芯片利用率的束缚,最大化发挥芯片的峰值性能,蔡权雄表示,“我们的纸面标称性能可能不及同类竞品,但是我们实际使用效率或实际算力比肩同类竞品,价格上还有一定的优势。”

对于定制类架构,市面上有声音认为通用性不足,牛昕宇表示,这恰恰是数据流能解决的问题,CAISA定制数据流架构是一个针对深度学习领域的通用架构,CAISA架构底层算子可配置支持不同计算方式,支持不同算子组合和拓展,不同框架和开发方式可通过端到端的编译器RainBuilder来支持实现。

多场景落地实现商用

目前,鲲云研发的CAISA芯片及加速卡产品等已在多个领域实现商用。鲲云科技为智慧安监、智慧油田、智慧化工等领域提供包括边缘计算及数据中心在内的整体解决方案。

所谓边缘计算有一个著名“章鱼论”。章鱼捕猎灵巧迅速,腕足之间配合娴熟,这是因为章鱼神经元只有40%在脑部,剩下60%分布在章鱼的八条触角上,以触角替代大脑思考,就近解决问题和快速反应,章鱼这种信息处理方式就相当于“边缘计算”。

随着技术的发展,人们越来越需要在“腕足”的边缘,实现计算和决策。“在这些场景中,‘降本增效’是核心需求”,蔡权雄表示。

例如在化工场景中,传统的安防监控系统已经比较成熟,摄像头监控系统基本部署完成,但视频结构化利用率较低,单纯依靠人工巡检不现实。

据介绍,鲲云科技采用边缘计算,对现场接入的百余路视频进行视频处理,实现全厂区24小时实时监控,及时发现火情、安全防护着装违规、作业场所违规操作等风险事件并报警,帮助安全管理中心及时做出反应。凭借CAISA芯片的高算力性价比,智慧安监在提升感知效率的同时,也能降低用户的使用成本,现已在国内超1000个项目中使用。

蔡权雄表示,许多边缘端场景还存在“碎片化”需求,因此厂商除了考虑提升芯片利用率,做到更高算力性价比之外,还需要思考如何提升通用性、软件易用性等。

除此之外,为面向高性能AI推理市场,鲲云推出星空加速卡X3,现已与浪潮、中国联通、飞腾、麒麟软件等企业完成产品适配,落地在边缘端及数据中心。

蔡权雄表示,数据中心更注重构建先进的AI算力基础设施,一方面,算力基础设施更新换代会降低数据的传输成本,导致更多的数据被收集,产生更大的算力需求;另一方面,算力密度越来越高,系统性能越来越强,部署成本越来越可控。

在他看来,边缘和云会有共存的关系,边缘侧主要进行实时处理,数据中心汇集后进行更深入的分析,二者都在快速增长中,且都有广阔的市场前景。

在首款数据流AI芯片实现量产并大规模商用后,鲲云科技并未停下脚步。据蔡权雄透露,明年鲲云科技将会推出第二代CAISA芯片,采用先进制程,采用CAISA4.0架构,最大特点是实现单芯片上解决所有AI的相关运算。

(作者:林典驰 编辑:孙超逸)

林典驰

记者

关注湾区能源、机器人、低空飞行等优势产业,努力讲好商业故事,邮箱:lindc@21jingji.com