探索生命科学大模型弯道超车:李彦宏所创百图生科推出AIGP平台

创业·投资申俊涵 2023-03-27 16:17

21世纪经济报道记者 申俊涵 北京报道

当微软、谷歌、百度等巨头公司纷纷加入AI大模型的全球竞赛,一些创业公司在大模型的垂直应用场景也展现出技术实力。

3月23日,百图生科在北京发布生命科学大模型驱动的AIGP——AI Generated Protein平台。同时,公司发布AIGP生态合作计划,希望将生命科学大模型的能力与医疗健康、药物设计、能源环保等领域的需求相结合。

百图生科并非无名之辈,其在两年前刚成立时便引发业内广泛关注。它在2020年由百度创始人李彦宏发起创立,百度风投CEO刘维担任公司联合创始人兼CEO。一年之后,国际机器学习专家宋乐博士加入公司成为CTO兼首席AI科学家。

同时,百图生科也在2021年完成上亿美元A轮融资,由GGV资本领投,百度、君联资本、蓝驰创投等跟投,公司创始人李彦宏持续追加投资。

今年初,ChatGPT的全网火爆把AI大模型带入到公众视野。百图生科花费两年多时间所构建了千亿参数的跨模态大模型 “xTrimo”也逐渐展露头角,它的出现意味着生命科学领域或将走向“ChatGPT时刻”。

“目前,国际上大模型能力较强的公司主要是谷歌、微软这种大型公司。虽然他们也在做生命科学相关的大模型,但更多是在发论文层面。国际上的生命科学公司层面,还没有具备很强大模型训练能力的公司。”宋乐说。百图生科具有大模型训练能力以及专业的生命科学团队,这种融合发展的方式在国际上具有领先性和高门槛。

刘维也指出,虽然国外在生命科学基础研发和AI基础研发层面,有很多领先的地方。但AI驱动下的生命科学研究方面,中国企业存在弯道超车的机会。百图生科的AIGP平台既希望服务于中国的生命科学研究者,也希望面向全球的研发者。

错位竞争,开启生命科学领域大模型创业

“大模型理念在2018年左右开始火起来,在AI界比较有关注度。我们在2020年成立百图生科,很重要的目的就是给昂贵又有很大价值的大模型技术找到应用场景,生命科学领域是很有价值的场景。”刘维在接受21世纪经济报道采访时说。

另一方面,在刘维看来,主流的互联网公司在自然语言的语料、技术层面有很深的积累,初创公司没有特别大的竞争优势。新一代大模型创业者应该走向更前沿,在新问题、新模态上寻找答案,与如今的主流大公司形成互补,这里边是存在机会的。

由此,团队创办了生物计算引擎驱动的创新药物研发平台——百图生科。成立两年多以来,百图生科蓄力打造生命科学领域的AI大模型xTrimo。据了解,该大模型从跨物种、跨模态的生命信息中学习蛋白质如何构成和实现功能、如何相互作用、如何组合和调控细胞功能的关键规律,从而破解生命的自然语言—— 蛋白质。

基于大模型,AI在一系列任务算法上取得明显的进展,除了更好地完成结构预测等基础任务外,也开始可以根据不同的问题输入,以生成的方式,设计创新的蛋白质,来回答各种生命科学问题。

3月23日,百图生科发布生命科学大模型驱动的AIGP平台。据了解,目前百图生科AIGP平台设置了3类功能模块。根据不同模块的输入和要求,AIGP平台可在较短时间内设计和生成具有特定性质的蛋白质。

“经过两年的发展,虽然百图生科的AI大模型和与之配套的大规模数据图谱、高通量验证体系都远不完美,但已经凝结了很多前沿技术的创新和探索。”刘维说。接下来,从开始展露一些能力到提高它的泛化能力和速度,需要专业伙伴的合作的加入,而且,合作伙伴也将得益这一系列尝试,实现前沿项目的加速研发。

“就像ChatGPT在2018年发布第一版的GPT-1,经过5年迭代达到现在的影响力。我们今天有点像2018年时的ChatGPT,希望5年时间内也把AIGP带到跟今天大家看到的完全不一样的水平,真的解决很多问题。”刘维说。

百度背景带来资源优势,新一轮融资正在推进中

此前,AIGP平台已经进行了一段时间的内测,有近20家合作伙伴和百图生科开展了AIGP联合研发合作,方向覆盖高性能弹头设计、新功能蛋白质设计、靶点挖掘和调控蛋白设计等领域,其中多个项目取得了阶段性的发现成果。随着此次的对外发布,AIGP平台将为更多伙伴,包括科研、环保、材料、消费等更多场景的需求,提供解决方案。

“类似于OpenAI接入到人力招聘、写作辅助的垂直行业公司,用大模型赋能这些公司的AI能力。百图生科也希望跟未来跟AI药物公司间形成合作关系,用预训练的大模型赋能他们AI任务模型进一步提升。”刘维说。

谈及百图生科与CRO企业的关系,刘维表示,百图生科跟主流的CRO企业间仍然是合作的关系。CRO企业的优势在于,对行业里面有解的问题做得更专业高效、成本更低、质量更可控。百图生科的模式是通过自身独特的技术,与合作伙伴共同投入、共担风险、共享收益,这不是服务的模式而是联合研发模式。

值得一提的是,李彦宏是百图生科的创始人和早期投资人。刘维对21世纪经济报道表示,背靠百度资源,为百图生科做好生命科学领域的大模型带来优势。百度为百图生科提供低成本的算力资源支持,同时,百图生科和百度在大模型技术上有一定互相借鉴的地方,两方团队还在NLP(自然语言处理)相关领域进行合作研发。

除了李彦宏的加持,百图生科还在2021年获得GGV资本、君联资本等的青睐,A轮时就完成上亿美元的巨额融资。刘维坦言,巨额融资背后,是大模型领域创业确实需要很高的投入,公司一年的研发投入在大几千万美元。

“好在我们的研发效率还挺高,团队同时跑四十多个生命科学研发项目,如果按照传统的生命科学逻辑研发,这可能需要花费十亿美金。”刘维说。得益于合作伙伴的资源平台的优势,百图生科的很多研发项目都有不错的产出预期,投入产出比是比较划算的。

同时,刘维透露,公司今年正在新一轮融资推进过程中。“做大模型很需要成本,我们希望找到愿意长周期投入支持这件事的投资方。一些既可以投入资金又可以带来资源,或者对行业问题有深度见解的产业投资人,也是我们所欢迎的。”他说。

(作者:申俊涵 编辑:林坤)

申俊涵

创投版记者

关注VC/PE行业,以及热门投资赛道里的创新创业公司。新闻线索及观点交流可加微信:shenjunhanedu