AI是一个科技战略问题。
21世纪经济报道记者李览青 上海报道
在各家大厂竞逐大模型的步伐中,近日才发布相关产品的蚂蚁集团无疑赶了个“晚集”。
9月8日,在上海举办的外滩大会上,蚂蚁集团正式发布金融大模型以及基于金融大模型能力的两款产品:C端智能金融助理“支小宝2.0”与B端智能业务助手“支小助”,从基础大模型走向产业大模型与产业应用。
而此时全国已有超过130家公司发布自己的大模型,百度“文心一言”、商汤科技“商量SenseChat”、腾讯“混元大模型”、华为“盘古大模型”等等都已通过国家网信办深度合成服务算法备案。
一直以来,拥有雄厚资金投入与数据基础的金融行业,被公认为大模型落地应用的前沿领域。然而,通用大模型的泛化能力似乎又与金融场景对“绝对精准”与“绝对安全”的要求背道而驰。
对于蚂蚁而言,AI大模型意味着什么?当蚂蚁集团参战开“卷”,为何选择垂直大模型产品?大模型在金融行业的产业化落地应用还有多远?
“AI是一个科技战略问题”
“无论对金融行业,还是对蚂蚁自身,AI都是一个科技战略问题。”
蚂蚁集团副总裁王晓航告诉21世纪经济报道记者,今天的产业技术变革不是一蹴而就的,如果没有长期以来AI全栈布局与积累,很难把握住这一轮技术变革的先机,而蚂蚁很早就做好了准备。
2021年8月,斯坦福教授李飞飞与上百位AI科学家联名发表《基础模型的风险与机遇》(《On the Opportunities and Risk of Foundation Models》),掀开学界对大模型的研究,而蚂蚁也由此开启了对大模型的内部实践研究,从支付宝开始探索百亿规模的AI模型。
“在这之后,我们慢慢探索出了大模型新的技术范式,即在预训练的基础上进行精调,当服务发生变化,基础模型不再需要重新训练,这大幅提高了我们工程的生产能力。”蚂蚁集团CTO何征宇提到,在2022年1月的一次公开演讲中,他就分享过大模型范式的探索。
21世纪经济报道记者了解到,2022年9月,蚂蚁集团内部开了一次战略性的会议,确立了集团整体AI的工程体系,必须围绕大模型来做整体的升级,
“今年3、4月份,相信所有中国科技企业都曾经过了一段焦虑期,最害怕睡觉,害怕刚一起床就发现有一个新的论文和产品要研究。”王晓航坦言,尽管大模型的涌现带来了各种各样的可能性,但这还是一个需要知识积累的技术,在扎实的AI全栈布局与巨大的资金投入下,大模型不会一夜之间颠覆某个行业,“这是一个持续、长期的过程。”他表示。
算力、数据、算法是推动大模型成长的“三驾马车”,蚂蚁的基础大模型在这三个层面都投入巨大。
算力层面,蚂蚁基础大模型平台具备万卡异构集群,其中千卡规模训练MFU可达到40%,集群有效训练时长占比达到90%以上;数据层面,除了全网通用语料与金融领域的优质语料,蚂蚁还注入了优质的研判分析数据,以及大规模知识工程所带来的超过270亿Token的知识量;模型层面,蚂蚁认为金融专属指令更能够代表大模型,解决特定金融任务的能力,其从真实场景中萃取了超过60万条以上的专属指令。
“大模型、生成式人工智能,是非常深刻的基础技术,就像电力在发明之初被运用于电灯与照明,但逐渐它会深入到人们生活的方方面面。”何征宇如是说。
金融全场景落地道阻且长
在“百模大战”下,每家公司都面临着不同的商业路径选择。
一方面,通用大模型与垂直领域大模型的发展能力截然相反,前者强调通用的泛化能力,而后者强调精准与精确专业。另一方面,“百模大战”背后是大模型全产业链的发展,云平台、计算机硬件、底层基础大模型、大模型落地解决方案、大模型应用程序与服务都是这个赛道上的重要一环。
对此,蚂蚁集团选择的路径是“卷”专业不“卷”云厂商。
“我们不做裸模型的开放,不卷云厂商。”王晓航告诉记者,蚂蚁希望通过平台和产品来帮助金融机构解决关键问题。
何征宇向记者表示,如果要为金融机构提供精调的落地解决方案,首先需要大量算力的投入,其次需要大量清洗好的数据与大量专业技术人才,而如今市场上这些资源都非常紧缺。
“我认为这些技术红利不应该只垄断在大公司,或者大平台手中,应该尽快降低门槛,让大模型技术得到快速普及。”何征宇指出,蚂蚁希望提供端到端的产品,让不了解大模型技术的员工与普通人也可以享受到技术红利,实现技术普惠。
蚂蚁集团这次发布的产品有两款,分别是针对C端用户的智能金融助理“支小宝2.0”,以及服务B端金融机构的智能业务助手“支小助”。值得一提的是,蚂蚁的这个大模型有点“卷”,8月底,它已通过证券从业资格、保险从业资格、执业医师资格、执业药师资格等专业试题测试。
“在大模型时代,想象力非常重要,但我们认为更重要的是把技术转化为规模化产业价值的能力,这需要解决产业的真命题。”王晓航在演讲中说道。
如此看来,蚂蚁的大模型产品如果要覆盖金融产业链条各个复杂环节,道阻且长。
复旦大学计算机科学技术学院教授肖仰华指出,从根本上来说,金融领域是复杂且严肃的应用场景。“严肃”意味着准确性要求极高,合规性要求极高,而生成式AI天生具备“幻觉”,其“一本正经胡说八道”的能力与严肃的应用要求存在天然矛盾,这一矛盾需要技术的调和。而复杂的金融场景是系统性的,例如从源头来看,在数据合规、数据隔离、知识私有化等等问题都会限制大模型的效果发挥。
在金融系统的安全方面,浙江大学计算机学院教授、浙江大学人工智能研究所副所长郑小林也表示,模型训练过程中,许多非线性预算是需要进行警示的,如果误差经过一层层累计,可能会成为比较大的金融安全隐患,这一安全问题需要个人、平台、监管的全面关注。
“现在大模型技术在通用领域的门槛正在降低,但真正深入到专业领域,牵涉风险管理、决策研判等领域,还是停留在想象阶段。”王晓航表示,如今大模型在金融行业的应用还没有成熟,需要金融机构、金融科技公司共同将大模型的技术能力转化成产品,实现产业落地的能力还需要1-2年。
(作者:李览青 编辑:陶力)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。