21世纪经济报道记者 申俊涵 北京报道
今年以来,ChatGPT的火爆出圈正引领新一波的AI浪潮。从国外的谷歌、微软、Meta,到国内的百度、阿里、腾讯、字节跳动,各大科技巨头纷纷加入这场AI军备赛。
能够带来伟大成就和巨量财富的地方,时常伴随着创新创业热潮的翻涌。王慧文、李开复、王小川等在科技领域、创投领域富有号召力的大拿们悉数登场,将这份AI创业的“英雄榜”变得越来越长。
其实从1956年人工智能的概念首次提出以来,人工智能行业经历过多次从高潮到幻灭的过程。此次ChatGPT的出现,再次让大家内心受到震撼。不少创投圈人士对记者表示,AI大时代所带来新鲜感和振奋感,比十年前移动互联网时代到来时还要更加强烈,而这或许也是诸多业内大咖选择跳出舒适圈奋力一搏的主要原因。
“我们惊叹于AI大语言模型的能力,让人工智能比以往任何时候都更接近人类、更加智能化,这让我们充满期待。”近日,创世伙伴资本CCV合伙人梁宇在接受21世纪经济报道专访时说。
在他看来,现在是通用人工智能(AGI)的奇点时刻,同时也是商业化应用的前夜。AI大模型还没有经过大量的商业包装和训练,需要从业者像园艺师一样去修剪,形成符合行业规律的商业化产品,这也正是创新创业的机会所在。
创业门槛急剧拉高,机构出手更加谨慎
《21世纪》:业界许多人把今年称之为AGI元年,您怎样看待ChatGPT所引领的这波AI新浪潮?
梁宇:倒推来看,2017年是真正的AI元年。当时Google团队发表论文《Attention is All You Need》,该论文提出了一种新的网络架构,称为Transformer。它仅仅采用注意力机制,不需要循环或卷积。
此前,机器学习的主流方法是深度神经网络带监督的学习。这篇论文出现以后,方法论开始转向。ChatGPT的GPT模型、谷歌的LaMDA大模型和百度的文心大模型都是基于谷歌的开源Transformer模型,在其基础上不断迭代。一直到OpenAI蛰伏五六年后,率先推出现象级应用ChatGPT。
其实内心最受震撼的不是普通用户和投资机构,而是产业人士。在上一波的人工智能创业浪潮中,大家预期很高,但实际产品效果根本达不到。一直到去年,很多人内心是存绝望的,也找不到突破的方向。ChatGPT出来后,大家才醒悟过来,原来人工智能可以做到这个程度,美国硅谷的热闹程度比中国还要早六个月左右。
《21世纪》:2016年AlphaGo打败李世石是上一轮AI创业热潮中的标志性时间节点,后来国内也出现AI四小龙等明星创业公司。现在我们再次看到很多投资界、创业界人士进入AI领域创业,这两轮热潮有哪些不同?
梁宇:首先,这一轮AI创业的目标更加精确。上一轮的AI创业大致集中在两个方向,机器视觉和无人驾驶,大家基于想象,不知道真正的工程能力能做成什么样。这一轮的创业更加聚焦,OpenAI给大家打了个样,所有的人才和资源都在向大语言模型的方向聚集。
第二,这轮AI创业的门槛被急剧拉高。构建大模型的算力成本更高,同时对底层大模型有真知灼见的算法人才非常稀缺。当然,经过上一轮AI产业的大浪淘沙,成功的创业者积累了深厚的根基,失败的创业者也积累了足够的经验,整体创业者的素质会更高。
第三,大环境本身也发生了很大的变化。上一轮AI创业热潮中,政策市场和创投市场环境都更加开放。现在创业者和投资机构都变得更加理性,有些人确实是在上一轮的狂欢中被伤到了。
现在凡是跟AI沾边的公司估值都比较高,因为需要的投入确实很大,行业天花板都很高,行业中也会有人去追逐高估值。但优秀创业者和优秀投资人的结合还是比较理性的,我们不能脱离事实的想象构建商业未来。整体来说,目前还是Gartner曲线(技术成熟度曲线)向上爬坡的前夜,大家都很兴奋,对产业的未来充满期待,但出手比较谨慎。
国内大模型追赶ChatGPT仍需时间,应用层创业机会更多
《21世纪》:您是否看好国内的类ChatGPT应用?跟OpenAI相比,国内做大语言模型的团队差距主要在哪些方面?
梁宇:我们是非常看好国内AI创业的,相信在中文语言环境和法律法规下,一定会出现中国的类ChatGPT应用,它们在中国市场也会更具竞争优势。但跟OpenAI相比,国内团队做大语言模型在三方面仍存在差距。
首先是经过优秀标注的数据集。目前中文数据集还在追赶阶段,随着业界共同努力,花钱、花时间来做这件事,这是能够赶上的。
第二是算力层面。去年,美国政府要求芯片厂商英伟达停止向中国销售部分高性能GPU芯片。这种对算力的封锁,拉长了大模型训练的时间。
第三是算法层面。语言模型能否做到像OpenAI那么智能,算力并不是最重要的因素,最重要的是算法层面。语言模型该怎样调参才能达到好的效果,这有点像可口可乐的秘方,需要不断的探索和研究。
更重要的是,我们希望大模型公司可以把平台留给开发者,就像IOS做的一样,让应用层参与者更多去做垂直领域的事情。如果这件事实现了,中国就很有优势。因为中国的公司在应用场景的开发上,在应用场景的丰富度上是远远超过美国公司的。中国公司在应用场景丰富度开发上和商业落地上,是走得非常快的。
《21世纪》:目前国内语言大模型市场的竞争格局是怎样的,您看好哪一派?
梁宇:首先是百度、阿里、腾讯、字节跳动等巨头公司。大厂的优势在于他们有实力不断投入资金、资源,有可能最先形成数据飞轮。
第二是国内一些技术实力雄厚的研究院。比如创世伙伴CCV聊过的两个团队,一个是北京智源人工智能研究院,他们几年前就开始专注在做语言大模型,语言训练的效果非常出色。2019年,他们成立了独立公司智谱AI,由清华大学唐杰教授担任首席科学家。另一个是沈向洋博士创立的IDEA研究院(粤港澳大湾区数字经济研究院),同样具有竞争力。我们很欣赏这种在大模型上扎实做了几年研究工作的公司。
第三,大家看到的王慧文、李开复、王小川等创业老兵,同样有机会做这件事。在科技领域、创投领域有影响力的人进军这个市场,能够帮助中国市场快速产出有价值的大模型。越是在竞争的环境中,创业企业的进化是越快的。
《21世纪》:我们注意到还有些公司基于数据集、算力、算法方面的困难,会战略性放弃做语言大模型,而是在特定的领域做相对的小模型,您怎么看待这件事的前景?
梁宇:大语言模型市场的竞争确实已经进入到白热化阶段,我认为除了百度这样的巨头之外,还会诞生一两家大语言模型公司。对大模型的投资是具备高风险、高天花板的,也是值得投入的,我们会支持跑在前面的大语言模型创业者。
同时值得注意的是,当百度、阿里等大公司专注在语言大模型战场时,基于Transformer的小模型对创业公司来说是更富有机会和商业前景的,我们也很关注这个领域的投资机会。
比如横向来看,在美国有家AI绘画公司Midjourney,它的底层模型是以文生图的模型,目前已经是10亿美元估值的独角兽公司。除了图片,3D领域的3D模型、3D环境生成,以及声音、视频领域同样富有机会,市场中还没有形成领头羊的局面。
纵向来看,做独立语言模型的公司必须跟产业结合才能拿到精确的数据,去帮助训练各种场景,这是未来商业化的根基。医疗、金融、汽车、游戏场景都具有产业机会,能够形成产业壁垒。
创业团队须兼具商业化能力和底层模型研发壁垒
《21世纪》:在ChatGPT所属的AIGC领域,创世伙伴资本近年做了哪些投资?
梁宇:在AIGC爆发的前夜我们已经投资了一些公司,他们所做的事情可以归为AIGC领域。比如我们在2017年A轮领投玩美移动PERFECT,这家公司成立于2015年,是一家人工智能(AI)和增强现实(AR)美妆与时尚技术商业解决方案提供商,去年已经在纽交所上市。玩美移动在3D空间生成人脸,为企业和消费者提供虚拟试妆及智能肌肤侦测等服务。
另外,我们还投资了AI医疗公司数坤科技,目前正在IPO进程中。它用自创的底层模型大量阅读CT影像和MR影像,生成人的数字三维模型。延伸来看,我们在垂直的无人车感知、3D环境生成领域也在进行投资。对我们来说,AIGC将是今年非常重要的投资赛道。
《21世纪》:在具体投资过程中,您倾向于投资什么样的创业团队?
梁宇:我们非常看重公司的产品商业化能力和行业认知,它要知道如何设计垂直领域的产品,如何抓住用户、增强用户黏性。同时在这个基础上,公司还需要在底层模型上有自己的研发能力,建立起高壁垒。
比如美国有一家成立两年的公司叫Jasper,它的底层技术模型来自ChatGPT,基于它进行产品化,做自动营销文案生成。Jasper的应用反馈情况非常好,很多文字工作者愿意付费订阅,公司也很快成长为独角兽公司。但ChatGPT出来以后,这项服务免费提供给用户,Jasper的价值是急剧下降的,它向用户收费变得不再容易。
所以创业公司要有自己的模型能力,否则即便前端应用包装得再好,当大象稍微踏过来一脚,它的脚指头就把你踩死了。当底座足够扎实,即便遇到浪的冲击,也没那么容易被击倒。
另外,创业者要理解产业,积累在垂直领域的数据。如果能够得到国家队的支持,获得来自政府的数据资源,或许能够真正帮助公司实现腾飞。比如政府部门有行政数据、公民数据、医疗数据等,这些数据脱敏之后开放给公司,将帮助语言模型训练得更好。
(作者:申俊涵 编辑:林坤)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。