华为哈勃,悄悄扶植两家清华新锐
偏爱名校精英。
撰文丨王硕果 编辑丨鄢子为
华为,接连入股两家创业公司。
6月上旬,华为哈勃低调入股生数科技。这是自4月投资面壁智能以来,哈勃今年下注的第二家AI大模型公司。
面壁智能和生数科技,分别成立于2022年、2023年,核心团队均来自清华大学。
面壁智能CEO,为知乎前CTO李大海。生数科技CEO,是本硕就读于清华计算机系的唐家渝。
AI赛道火热,华为哈勃看好这两位青年才俊的潜力。
今年,面壁智能推出千亿多模态大模型对话助手Luca,称多项能力与ChatGPT相当;生数科技也推出了文生视频模型Vidu,性能对标Sora。
精英组队
哈勃投资是华为全资控股的投资机构。
据企查查网站,其有两个主体,分别为哈勃科技投资有限公司、深圳哈勃科技投资合伙企业。
此前,华为哈勃的投资,聚焦硬科技方向,入股多家半导体芯片企业,今年接连扶植两家清华新锐,显示出对AI赛道的重视。
据IT桔子数据,哈勃今年接连向人工智能领域下注,投资金额累计达1.32亿元。
这家巨头,偏爱名校精英。
其入股的两家公司,创始团队结构相似,均背靠清华大学。
生数科技的核心成员来自清华大学人工智能研究院,面壁智能的创始团队脱胎于该校自然语言处理实验室(THUNLP)。
一众清华面孔组成生数科技高层。
除CEO外,其首席科学家由清华人工智能研究院副院长朱军担任,CTO鲍凡是唐家渝同门师兄、朱军的课题组成员。
资本看好这支清华系团队。去年6月至8月,生数科技连续完成两轮融资,累计获得上亿元。
今年6月,哈勃斥资入股,参与其A+轮融资。
面壁智能的成长路径类似。
其联合创始人刘知远,是清华大学计算机系博导,研究方向为计算机自然语言处理;公司CTO曾国洋,今年26岁,是竞赛保送生,大二就进入清华自然语言处理实验室。
据李大海介绍,面壁智能科研团队共有100多人,清北毕业员工数量占比高达80%,平均年龄仅为28岁,在权威期刊会议发表论文百余篇。
创立面壁智能前,李大海为知乎CTO,从零开始为平台搭建搜索和推荐业务,发起AI“智能社区”,增加月活跃用户数。
去年,AI浪潮汹涌,李大海在深入调研后,决定加入面壁智能。
当时, ChatGPT 火爆,所有人都在谈论AGI(人工通用智能),他跟该公司核心成员都聊了一遍。确认AGI是每个人的信仰后,李大海果断加入。
老东家支持其创业,同年4月,面壁智能获得知乎数千万元人民币的投资。
一年后,哈勃入股,成为其A轮两大投资人之一。
接连推新
两家创业公司,在较短时间内,均推出了新产品。这是吸引华为哈勃等机构投资的重要原因。
4月下旬,生数科技联合清华大学,发布中国首个长时长的视频大模型——Vidu,性能对标Sora。
唐家渝
据介绍,Vidu支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
生成视频不但流畅连贯,没有明显的插帧现象,而且镜头语言丰富,同一视频可切换远景、近景、特写等不同镜头,包括长镜头、追焦、转场等效果。
“Vidu在16秒长期保持和语义理解等方面表现得非常突出。”生数科技首席科学家朱军评价道。
另一边,面壁智能推新动作不断。
5月,其千亿多模态大模型对话助手Luca正式面世。CEO李大海表示 ,Luca的多项语言模型能力与ChatGPT相当。
同月,面壁MiniCPM-V2.0上新,在影像视觉处理上表现出色:
高清图像解码技术可以精准识别细节纷繁的街景,还能识读2300多年前的清华简上一些难以辨别的古老字迹;最新模型“Eurux-8x22B”,被誉为开源大模型“理科状元”。
事实上,早在去年,面壁智能就推出了基于群体智能的“大模型+Agent”应用——ChatDev智能软件开发平台。
制作小游戏、网站开发、线上活动创意设计等诸如此类的需求,只需要用户通过ChatDev描述项目名称和相关想法,便可快速实现。
用李大海的话来说,一位普通用户“只需要一杯可乐的时间,用不到一美元的成本”,就能做出一个小软件。
商业化初步落地。
目前,面壁智能已携手招商银行、数科网维、知乎等,将大模型与Agent技术部署应用于金融、教育、政务、智能终端等场景。
独辟蹊径
李大海与唐家渝,有个相同特质,不迷信前人走过的路。
比如,GPT强调“大力出奇迹”,而面壁团队的做法,是通过小模型预测大模型性能:
先在参数量为0.009B到0.03B的模型上做训练,再外插到2.4B的模型上预测性能,最后,训练2.4B的模型,发现性能确实在预测范围附近。
这一方法事半功倍,先在小模型上做实验、调参数,可以降低训练成本。
公司成立之前,作为北京智源人工智能研究院“悟道”项目的成员,面壁团队从2020年就开始训练语言大模型。
过往经验,让他们知道大模型需要什么样的数据。
“大家很容易陷入一个误区,过度关注数据的绝对量。其实,数据的质量,如何利用数据,以及对数据的认知才是更重要的事。”曾国洋称。
因资源受限,团队很早就使用分布式加速、参数微调等方法,降低成本。2022年,面壁团队参数微调的工作,还发表在Nature子刊上。
生数科技的打法类似。
技术路线上,生数采用的是和Sora一样的融合架构,但在产品路径上,两者不同。
Sora团队选择all in长视频,其背后有Open AI的技术实力,以及微软的算力支持。初创公司生数科技的条件,无法与之媲美。
唐家渝团队选择从2D图像开始,再拓展到3D和视频领域。
视频本质上是图像在时间序列上的扩增,可以看成连续多帧的图像,在图像上的工程化工作,比如数据的收集、清洗、标注以及模型的高效训练等经验,是可以复用的。
整个2023年,生数主要资源都放在了图像和3D上。
到今年1月,才上线4秒短视频生成。2月,Sora发布之后,该公司进展加速,4月可生成16秒短视频。
大模型赛道,国内外各团队竞相“秀肌肉”。
这两支清华系团队,刚开始热身,期待跑出不俗的成绩。届时,入股早的华为哈勃,有望获得超额收益。
题图来源:网络
(作者:王硕果 编辑:鄢子为)