AI立法进行时②:大模型商业化艰难探索,是闪电战也是持久战

合规科技诸未静 2023-08-03 09:59

落地商业本质,发现商机更为关键。

21世纪经济报道 记者诸未静 上海报道

编者按:

2022年,生成式AI发展为人工智能发展注入一针强心剂,ChatGPT的横空出世,被视为通用人工智能的起点和强人工智能的拐点,引发新一轮人工智能革命。人工智能发展似乎找到了自己的主流叙事。

不过,技术创新的同时也带来了监管难题,我们面对的不是近在咫尺的当下,而是想象触达不到的未来。对于颠覆性的人工智能技术,全球正在进行治理话语的竞赛,中国将会如何通过立法来贡献出具有中国特色的AI治理路径?如何既拥抱技术发展,又能有效规制风险?之前南财合规科技研究院推出AI契约论系列报道以及重磅智库报告《中国AI治理的独立思考——生成式人工智能发展与监管白皮书》,在此基础上,将继续推出AI立法进行时系列,以期为中国AI治理提供有益思路。 

自去年11月底ChatGPT发布以来,全球关于生成式AI或大语言模型(large language model,LLM)的投资热情持续高涨。

这种“集体躁动”,甚至热过如今盛夏的天气。其间热度既表现在大模型的迭代速度上,更体现在大模型的商业落地进程上。

经纬创投创始管理合伙人张颖引用了一组调研数据:从今年3月到5月,召开业绩电话会议的标普500指数的公司中,有110家公司的高管提到了AI,这是过去十年的3倍。

21世纪经济报道记者梳理发现,仅今年上半年,就有第四范式、出门问问、云知声、声通科技等多家AI企业陆续进入IPO进程。

不过,多位业内人士在接受21记者采访时表示,企业在大模型商业化落地,推动实际效益转化方面还面临诸多痛点:如何精准切中市场需求?如何保证足够的资金支持?此外,算力使用、高质量训练数据集以及安全可解释的问题,也亟待解决。

在7月初举办的2023WAIC(世界人工智能大会)商业AI高峰论坛上,上海证券交易所市场发展部副总监卢雄鹰就直言,人工智能企业拥抱资本市场竞争中面临着一些挑战,比如商业模式不够成熟,可以落地的商业化场景尚未完全形成,要能够产生持续的收入和利润。在论证人工智能企业技术先进性方面,也比较难通过纯粹的技术指标来判断科创属性。

军备竞赛

据不完全统计,目前国产的大模型总数已经超过100个,“百模大战”已是既定事实。

除了互联网巨头外,商汤科技、云从科技、科大讯飞等人工智能赛道上市公司,光年之外等初创企业,各大高校科研单位,均先后发布了大模型。

“技术圈的特点是‘FOMO’(Fear Of Missing Out),害怕错过的恐惧带来了很多焦虑。”豌豆荚创始人王俊煜在近期的专栏文章中指出,投资人、创业者想要知道,大语言模型是不是会带来下一个像字节跳动这样的机会?

7月,21世纪经济报道记者走访WAIC上的多家展商之后发现,目前国内的大模型创业,相较于面向C端用户的类ChatGPT产品,行业更多选择发布面向B端用户的“行业大模型”。

“让个人客户买单很难,基本都是企业客户。”WAIC上的一家大型展商的市场负责人向21记者分析,因为目前行业数据多被分割在不同的行业,服务B端客户的更具针对性,也能更快获得先发优势。

事实上,生存一直是困扰创业者的难题。在没有形成自身造血能力之前,人工智能创业公司的烧钱速度惊人。公开税单显示,OpenAI在2016年的开支就已接近1100万美元,其中约700万是人员工资。

放眼国内,行业面临着投资金额大、回报周期长、成功率较低、行业竞争激烈、市场合规等问题。据量子位智库发布的《WAIC2023十大AI商业落地趋势》显示,国内一级投资人出手谨慎,实际交易金额较少。今年上半年国内大约有20+家大模型公司获得超过60亿元的融资,金额在全球占比仅为6%。

“投资圈共识是,最后能跑出的大模型公司最多只有10+家。”报告结论指出,投资方认为在大模型层面的未来格局,除了BAT、科大讯飞、已有的融资玩家和上面两家公司,其余公司机会较少。因此目前新创业公司中重点押注融资量级最大的两家——智谱AI和MiniMax,其余中小企业和新进场玩家融资较为困难。 

暴力美学

许多争相入局的参赛者,正在渐渐意识到,大模型的竞争,已经从闪电战转向了持久战。

中金公司研究团队在WAIC会议期间发布的报告《AI浪潮之巅》中指出,大模型的迭代是一场“暴力”填数据、拔规模而造就的“美学盛宴”。其估算,大模型高昂的成本、较大的能耗令人难以忽视。据测算,GPT-3 训练所需算力成本约1200万美元,所产生二氧化碳排放量达362吨,对厂商的资金压力以及训练当地的环境压力较大。

IDC分析指出,从长远来看,随着大模型的数据量级达到万亿规模,数据的多少和模型的性能收益之间容易出现边际效应递减的现象。如此来看,一套行业内认可的技术评估标准就显得尤为重要,需要通过技术评估推动大模型与行业深度融合,支撑起产业转化。

大模型的发展,还向算力提供方提出了更高的要求:参数量指数级增长,如何高效、安全、稳定地训练大模型?

“客户的需求正从以前的CPU向GPU调整,巨大的GPU需求将同步带动算力、存储、网络等云计算相关产品的需求。”优刻得董事长兼CEO季昕华此前曾在接受21记者采访时分析,目前AI算力方面最明显的挑战是显卡短缺,以及如何把大模型在实际场景中落地的问题。

算力短缺会是长期问题吗?季昕华表示,随着参与大模型训练的企业越来越多,用来训练大模型的数据量越来越大,对推理的要求也越来越高,大模型的应用会越来越广。多种因素作用下,短期内很难能够满足市场的算力需求。

此外,受制于算力,多数大模型需要借助云端算力来帮助训练。但是,由于训练数据的敏感性,多数企业仅愿意将大模型的训练数据留存在本地部署,难解的矛盾就此产生。

随后,“小模型”这一概念成为许多人的创业选择。中金前述报告指出,与大模型相比,小模型的训练数据量与参数量较少,其优势在于“专精”,可满足特定任务需求。AI模型当前仍以小模型为主,赋能安防、消费、金融、工业等众多行业。小模型尽管泛用性较弱,但贴近真实场景(具备行业know-how),且算力要求低、能耗小,一些厂商的数据保护意识较高,都使得小模型仍会在诸多场景具有优势。

试水变现 

人工智能概念诞生60余年间,规模化商用并非坦途,概念的火热一直以来未能助推技术突破与商业应用。2022年,生成式AI发展为人工智能发展注入一针强心剂,但商业化落地也一直是困境。

不过近期,AI商业化的空间正在不断打开。

7月18日,微软在全球合作伙伴大会上公布了面向商业客户的人工智能工具价目表,Office 365 Copilot的定价为每用户30美元/月。

市场分析人士认为,微软此次产品定价打开了人工智能工具的商业化空间。消息传出后,微软股价一度涨超4%,创历史新高,市值达2.67万亿美元。

聚焦国内市场,比起宏大的市场前景设想,最先进入大众视野却是一款价格为9.9的AI写真小程序:妙鸭相机。

“妙鸭相机所使用的技术并不新鲜,其所用的AI绘画模型技术都是公开的。”一位北京的资深算法工程师向21记者分析,其背后的技术是一种基于LoRA(Low-Rank Adaptation of Large Language Models)模型的微调技术。

“就是一个简单的插件,LoRA模型会与大模型结合使用,从而实现对输出图片结果的调整。”他进一步做出比喻,如果说大模型是素颜,那么LoRA模型可在大模型基础上对其进行化妆、打扮。

百模大战的后半场,新一轮比拼已从技术性竞争进入了生态性竞争。海外Stable diffusion、Llama 2等大模型接连宣布开源,大幅降低了AI领域的技术门槛,妙鸭相机小程序的爆火更是在暗示当下,发现商机更加关键。

天使投资人、互联网专家郭涛在接受21记者采访时表示,“妙鸭相机的出圈对于AI创业者来说具有良好的借鉴意义,即不需要从零开始开发技术模型,而是关注垂直细分市场的强需求赛道,在已有的大模型技术基础上进行特定的数据训练及精调。”

热浪之后,本轮人工智能周期也必将回归冷静,落地商业本质。

有一组值得注意的数据是,据权威流量分析平台网站Similarweb的数据,今年6月份ChatGPT全球访问量、独立访客数分别环比下降9.7%和5.7%。

“我们既不会因为FOMO而仓促出手(Fear Of Missing Out),也不会因为JOMO(Joy Of Missing Out)而过于保守。”经纬张颖也在7月的一场主题为《AI的远与近》分享中表示,科技行业的投资就是这样,太JOMO了会错过科技大浪潮的板块性机会,太FOMO了又可能会被泡沫反噬。

毕竟,历史总是在后视镜中才会变得清晰。

(本报记者郭美婷对本文亦有贡献。)

统筹:王俊

记者:诸未静

编辑:王俊

(作者:诸未静 编辑:王俊)

诸未静

记者

常驻上海,聚焦知识产权、未成年人保护、数据安全、游戏合规等新业态话题。微信:zhuweijing1028