21世纪经济报道记者 王俊 实习生 罗洛 北京报道
大模型的竞争格局迎来重要节点。
近日,脸书母公司Meta宣布将推出开源大型语言模型Llama 2,可免费用于研究和商业用途。原本与OpenAI长期、深入合作的微软则成了此次Llama 2的“首选合作伙伴”。
去年底以来,OpenAI借助ChatGPT在全世界范围内点燃了大语言模型(LLM)的研发、应用之火,“百模大战”上演
OpenAI和谷歌成为这轮AI变革中最强劲的行业领先者。但是,Llama 2的开源商用,给既有商业格局投下了一颗足够震荡的“石子”。Meta这个在本轮AI变革中的后起商业巨头,似乎想用开源的方式放手一搏。
“我们相信,开源的方法是当今人工智能模型发展的正确途径,尤其是在技术进步日新月异的生成式领域。”Meta在其官网文章中表示。
从更长远的视角来看,近几个月开源竞速,开源方的野心不仅在于短期的商业价值,而是想要争做大模型时代的“新 Linux”,搭建一套生态系统。
开源为更多想入局者提供想象空间
此次Meta发布的Llama 2系列包含70亿、130亿和700亿三种参数版本,还提供了针对对话聊天场景微调的Llama-2-chat模型版本,其模型信息和起始代码全部开源。对比今年2月发布的LLaMA,Llama 2训练所用的token数量翻了一番,多达2万亿。Meta表示,在包括推理、编码、熟练程度和知识测试等多个外部基准测试中,Llama 2的表现均优于其他开源语言模型。
其实,在ChatGPT发布后,Meta就紧跟着推出了类GPT大语言模型LLaMA。模型公布后不久,其源代码文件便在4chan论坛上泄露,LLaMA却因祸得福,引来了大量开发者的关注,激起一波GPT平替风潮。基于LLaMA构建的模型,如Alpaca、Vicuna、Koala、ChatLLaMA、FreedomGPT和ColossalChat等陆续出现。
此次,Llama 2的免费开源,再次向采取闭源方式的OpenAI的GPT-4和谷歌PaLM发起了一次猛烈的进攻。
目前OpenAI的主要收入来源包括订阅费、API许可费、与微软深度合作所产生的商业化收入等。在API许可费方面,OpenAI将GPT-3等模型开放给别的商业公司使用,根据用量收取费用(文字类模型按照文字生成量、图片类模型按照图片生成张数)。在调用过程中,其他公司不会接触到模型的细节和源代码,而仅是通过OpenAI提供的API接口进行调试以及使用。
OpenAI凭借领先优势,一定程度上跑通了商业化之路。近期,创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示,ChatGPT以70%的应用率成为美国小型企业应用最多的生成式AI产品。据报道,今年6月,美国红杉资本发现在其投资的 33 家创业公司和上市公司中,65% 已经上线了大模型应用、94% 正用 OpenAI 的大模型接口(API)开发应用。
但是,开源在搅动着已有的竞争格局。
今年5月,谷歌内部泄漏的文件《我们没有护城河,OpenAI也没有》在SemiAnalysis网站上传播,文章的核心观点包括:开源AI用极低成本的高速迭代,已经赶上了ChatGPT的实力;数据质量远比数据数量重要;比起开源社区需要谷歌,谷歌更需要开源社区等等。文章作者指出,与开源AI竞争的结果必然是失败。
“门槛每天都在降低。”一位业内人士告诉记者,大模型的门槛正被开源踏破。
开源为更多想要入局者提供了想象空间。开源平台和开源生态将助推大模型的快速迭代与落地应用,尤其是对于缺少算力和资金的中小企业而言,开源打开了一个充满机会的世界。
“通过开放人工智能模型,可以让每个人受益。”Meta称,开源让初创公司、创业者和研究人员有机会使用开发难度高的工具,在这之前,他们难以获得足够的算力支持。
开源竞速 搭建生态的吸引力
“总体来说,OpenAI GPT系仍一骑绝尘,但训练成本高,难复现。而开源大模型借助更大标识符训练数据集、DeepSpeed、RLHF等方式,实现低训练成本和高性能,超大模型以下大模型的壁垒正在消失。”国盛证券的研报指出。
不过,也有业内专家向21世纪经济报道记者分析,开源后壁垒并没有那么容易破除,高质量、标注过的训练数据集尤其是专业模型的壁垒。
国金证券研报也指出,LLaMA等优质开源模型的推出极大地加速了下游行业AI应用开发效率。基于“通用基座+迁移学习+微调”的垂类AI模型开发范式或将成为主流,优质的行业数据资源成为影响模型性能的关键。
不过,近几个月来,开源仍在竞速,并持续影响着目前的人工智能发展。
除了LLaMA系列外,目前应用较广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。国内的例子则有百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。
国盛证券指出,开源有利于防止大公司垄断,破除商业禁用限制。开源大模型的蓬勃发展,有望弥合开放模型和封闭模型之间的质量差距,促进破除商业化禁用限制的目标。从算力视角来看,开源还有利于降低算力成本,使大模型的使用“普惠化”。
目前开源的商业模式主要包括:1、靠服务变现;2、靠授权费变现;3、许可证、标准和能力评价体系的发展——这是开源大模型商用程度深化的催化剂。
不过,值得强调的是,对于Meta甚至众多开源者而言,开源的野心不仅是短期的商业变现,其更想引领规则设计以及搭建生态。
4月,在扎克伯格与分析师的一次电话会议中,他就谈到,如果行业能够在meta使用的基础工具上达成标准化,那么meta就能从其他人的改进中受益,这样会更好。
上述谷歌内部泄漏的文章同样提到,不同开源模型所组成的生态系统永远是OpenAI的潜在竞争对手。
中国也在积极建设人工智能生态。科技部副部长吴朝晖在2023中关村论坛上表示,中国坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。
中国科学院院士、中国计算机学会开源发展委员会主任王怀民也表示,中国发展开源生态要打造ChatGPT这样的明星项目,可以吸纳更多的开发者和拥有定义用户的主导权。建立起人工智能开源创新的新平台后,可以有效支撑AI芯片、智算中心、超算中心等发展,体现出在该领域的影响力和竞争力。
(作者:王俊 编辑:诸未静)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。