大模型落地问题走向台前,专业场景或率先突破

21Tech董静怡 2023-10-31 11:48

大模型的第一幕已经结束,第二幕正要开启。

21世纪经济报道记者 董静怡 合肥报道

2023年是AI大模型大爆发的一年,ChatGPT在全球掀起了一股AI大模型井喷式的发展热潮,国际国内各大科技巨头以及AI独角兽都在参与AI大模型的角逐,相关技术和产品加速迭代演化,以大模型为代表的新一轮AI技术正在开创一个新的AI时代。

技术所产生的颠覆性的影响正逐渐深入到产业界,传统的产业形态和产业模式开始重构。作为大模型的重要应用方向,生成式AI已成为企业数字化转型的重要工具之一,为企业数字化转型注入革命性的创新与颠覆性力量。

Gartner预测,2026年超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用,这也将为产业发展带来巨大的机遇与挑战。

然而,来到2023年的尾部,大模型实际的落地情况却并不理想,业内期待的生成式AI在各个行业掀起的革命性变革也并未发生,新技术祛魅,落地难点和挑战接踵而出。

“在这个‘百模大战’甚至‘千模大战’的时代,如何将技术转化成真正的生产力,以生态之力破局,加速生成式AI在企业级的落地是现在关注的问题。”近日,在信百会2023年会期间,神州数码董事长兼首席执行官郭为在“数云融合与企业级大模型应用实践”主题论坛中表示,“想在一个行业里深度解决问题,还有很长的路要走。”

“一公里”还是“一平方公里”?

通过生成式AI实现了数据和知识的自动生成过程,这就使得数据生成的飞轮加速。郭为在论坛中表示,过去是靠系统数据、另类数据加工来产生新的知识和数据,而今天通过大模型自动生成新的数据和知识,使得数据资产的生成在AI驱动下变成了一个永动机。

这是一场人类经济生活、社会生活的巨大变革。如何把生成式AI和数据资产紧密地结合在一起,创造出新的业务,是企业数字化战略的根本目标和出发点。

几乎所有企业都对生成式AI技术展现出了强大的关注和兴趣。神州数码副总裁、CTO李刚表示,这一轮的技术变革,不仅是技术层面,企业各个业务单元,包括CEO在内的高层决策层,几乎都是第一时间启动了密切的关注和讨论。

“这样的并发式创新,肯定会加速大量企业技术实践落地,但是早期的试错成本也难以避免,因为每条路上都在并行往前跑,而且相互影响。”李刚表示。

在大模型的落地过程中,有不少在B端的应用尝试,但至今却没有爆款应用诞生,其中关键的问题在于生成式AI技术在企业的场景落地有着一系列的挑战需要解决。

360智能产品部技术总监李晖表示,现在面临最大的挑战是数据方面的挑战。首先,模型的训练数据要求是海量的,且对质量要求极高,因此对于数据的积累和储备要求是非常高的;此外,ToB的行业应用领域,特点是数据不能出域,即便公司规模再大,积累的数据也是有限的。

“作为行业模型来说,怎么让行业模型打破企业的限制,把海量的行业语料汇集起来,训练通用行业大模型,这是在ToB领域的一个极大挑战。”李晖表示。

李刚回忆,在一次闭门交流时,有客户抱怨说看上去是大模型企业落地的“最后一公里”,但走起来怎么也不止一公里。

另一位客户则表示,大模型距离企业应用的距离应该是“一平方公里”而不是“一公里”,即大模型企业落地需要的是更多方面的就绪,它不是一个线性的过程,而是综合的过程。

另一方面,大模型的应用将为企业数字化转型助力。李刚表示,大模型的出现,进一步提升了数据资产的价值,之前没有被关注到的大量以非结构化形态存在的数据,甚至以非电子化形式存在的数据,可能会是企业核心竞争力、知识竞争力的体现。

“千万不要过高地估计了未来一两年的收获,但是也千万不要低估了未来十年的影响。”李刚表示。

专业场景先落地

李刚表示,生成式AI技术在企业内部落地,要和企业的管理流程、技术紧密结合在一起,它一旦涌现出大量的业务创新场景,就可以形成业务和行业数据不断累积的飞轮效应,还能够进一步形成面向行业的能力输出,形成竞争优势,把数据资产变现,甚至改变一个行业的样貌。

在特定场景下,如果有精准的知识库语料、优化的知识库提示,可以获得比较精准的结果。目前,已有企业快速探索,借助大模型实现了在某个特定业务点上的创新。

某国际医疗企业代表举例称,在和外部机构沟通产品认证上市时,有非常多的沟通对接,在这个过程中,每个人回复的知识体系、知识深度是不同维度的,“由于信息不对称、回复得好或不好,可能会导致产品上市有些延迟,这一直以来都是我们的业务痛点。”

该代表解释称,该企业在过往有十万份的应答文档,但把过去各种各样的信函作为静态文档放在文档库里,检索、查询以及对文档进行有效知识管理和做知识图谱,始终没有非常好的解决方案。

大模型技术火爆后,他们正在用一种知识库管理,以及知识评级的方式,使得跟外部机构之间的沟通更顺畅、更高效。

“有了现在的解决方案,我们可以更快更好地提取过去文档或者说自己内部知识库里的文档信息,并且进行优选、做评级,这样可以帮助到负责注册的同事,让他们在不同的背景情况下、不同成熟度情况下,能有高标准的反馈。”该代表表示。

在这中间,知识的萃取是一个难点,因为十万份文档的结构并非完全一致。另一方面的挑战则是,基于过往的内容,精确精准地生成新的内容,做到效率的进一步提升。

“在企业环境里,我们总觉得大模型离真正商用差一点点。”李刚向21世纪经济报道记者表示,“数据可能需要变成知识图谱或向量库的形式,才能够实现稳定输出,这样的工作在早期需要以服务的方式帮用户实现。”

论坛上,神州数码推出了神州问学平台,该平台为企业提供模型、算力、数据和应用的连接能力,既是一站式企业大模型集成平台,也是企业的大模型运营平台,帮助企业加速生成式AI的创新、降低AI应用的开发门槛及落地成本,让企业能够更快地将自身业务需求与大模型技术结合,实现业务流程的智能化。

李刚向记者表示,企业知识库问答类场景是非常容易先落地的,针对此场景,神州数码已经掌握了系列框架。

他进一步表示,类似营销、法务、人力资源、培训等专业场景会先于行业场景落地,明年需求会逐渐浮现。

“大模型的第一幕已经结束了,第二幕正要开启,什么是第二幕?我认为大模型真正的企业应用场景即将爆发。”李刚向21世纪经济报道记者表示。

(作者:董静怡 编辑:张伟贤)

董静怡

21记者

关注人工智能、科技出行、电商,联系方式:18067308354(微信同号)