逐浪AIGC丨AI大模型时代,火山引擎要做聚合平台

21Tech白杨 2023-06-29 16:26

火山引擎判断,未来的大模型市场将是一个百花齐放的多模型生态。

21世纪经济报道记者白杨 北京报道

大模型浪潮扑面而来,几乎所有企业都在思考如何迎接。经过半年的观察和实践,字节跳动旗下的ToB品牌火山引擎也找准了自己的定位。

6月28日,火山引擎正式发布大模型服务平台“火山方舟”,旨在为企业客户提供模型精调、评测、推理等MaaS(Model-as-a-Service)服务。

火山引擎总裁谭待表示,对于中国的大模型发展,火山引擎已经有了几个关键判断:首先,未来的大模型市场将是一个百花齐放的多模型生态,在这个生态系统中,将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型,“这是由安全信任、行业壁垒和成本因素共同决定的。”

其次,在未来,企业尤其是行业头部企业,自身对于大模型的应用,将会是“1+N”的应用模式,即企业通过自研或者与三方模型服务商的深度合作,形成企业自身的1个主力模型,这个主力模型之外,在不同的场景中,企业还会同时应用N个外部模型。

聚合多方大模型

在此之前,已有多家云厂商相继推出了MaaS服务,他们的思路大都一致,都是基于一个通用基础大模型,为不同行业提供具有行业属性的行业大模型。

而火山引擎另辟蹊径,采用了一种聚合模式。据介绍,火山方舟已集成百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研院所的大模型。基于这种多模型架构,企业客户在火山方舟上便可同步试用多个大模型,并选用更适合自身业务需要的模型组合。

谭待在接受21世纪经济报道采访时指出,火山引擎和其他厂商的理念可能不大一样,“友商推出模型平台,从模型到模型平台以及各种体系都是自己做的,是很封闭的端到端,他们可能认为未来一个模型就够了,但我们不是这样想的。我们认为未来肯定不是一个模型,而是多模型,所以我们的平台一定要支持多个模型。”

除了理念上的不同之外,谭待还提到,火山引擎能做多模型架构,有一个很重要的原因,是这些业界做比较好的大模型,本身大部分的训练都是在火山引擎上。“所以我们已经跟这些大模型建立了很强的合作关系和信任感,他们也自然而然会把推理也放到火山引擎上。”

对于哪些大模型可以进入火山方舟,谭待称,“我们希望火山方舟是一个精选的结果,所以希望那些确实是训练完成,并且在合规等方面都做比较好的,已经达到可用形态的大模型才放到方舟平台上。第一批公布的是7家,后面还会陆续接入更多大模型。”

当然,做聚合平台,也意味着火山引擎要面临更多风险和挑战。谭待表示,企业使用大模型,最担心的是数据泄露;如果将大模型私有化部署,企业将承担更高的成本,模型生产方也会担心知识资产安全。

据火山引擎智能算法负责人吴迪介绍,“火山方舟”已上线了基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现了模型的机密性、完整性和可用性保证,可适用于对训练和推理延时要求较低的客户。

此外,吴迪透露,“火山方舟”还在探索基于NVIDIA新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案,更全面地满足大模型在不同业务场景的数据安全要求。

聚焦平台而非模型

对于火山方舟平台,外界还关心的一个问题是:如果字节跳动有了自己的大模型,火山方舟会如何平衡自研和第三方模型的关系?

对此,谭待向21世纪经济报道记者表示,火山方舟会是个开放的平台,字节内部其他团队如果做好了模型,也会放到方舟平台上对外提供,它在方舟上就是众多模型中的一个。“最后选择字节的模型还是其他模型,这是由客户来做选择的,而不需要火山引擎来做平衡。”

所以,在服务模型应用方的过程中,火山引擎提供的不是模型能力,而是帮助应用方更好使用模型的能力。按照谭待的说法,火山方舟为企业提供的是大模型使用的一站式工作台,不仅包含了模型试用、评测、接入、精调等能力,也通过训推一体、弹性调度、算子优化等能力,帮助应用企业全面进行成本优化。

据吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。

在其看来,训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素,“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”

因此,企业在火山方舟进行的自定义指标和评估数据的积累,也将成为企业在大模型时代宝贵的数据资产。另据吴迪透露,字节跳动内部已有十多个业务团队在试用“火山方舟”,覆盖文本和图像生成、对话、代码辅助、信息检索、营销创意、电商、办公效率等领域。

吴迪表示,火山方舟希望在模型供应商和模型使用方之间,促成“研究-训练-应用-变现-反哺研究”的正向循环。“对模型提供方来说,火山方舟能够帮助大家以更低的成本触达海量客户,用更小的代价在ToB市场规模化;对模型使用者来说,则可以便捷地接触到众多高质量的基座模型,为不同场景选择最合适的模型。”

但谭待也坦言,“每一次技术的大变革,都会带来体验创新的新机会,而火山方舟还在起步阶段,工具链和下游应用插件需要持续完善。”接下来,火山方舟还将接入更多大模型,并逐步扩大邀测范围,加速大模型在各行各业的应用落地。

(作者:白杨 编辑:骆一帆)

白杨

IT版记者

关注科技互联网领域报道。微信:by_xiansheng(加好友请备注姓名、公司及职务)