智能涌现⑳|人工智能体AI Agent到来 如何成为大模型未来入口

深公司Insight石恩泽 2024-06-05 16:32

大语言模型的下半场

21世纪经济报道记者 石恩泽 深圳报道

“我希望你能通过问题引导让他(我儿子)真正理解这道(数学)题,而不是直接给他答案。”网络教育平台可汗学院创始人萨尔·可汗在一则OpenAI发布的视频中,向GPT4o下达着指令。

接受GPT4o指令的“她”,作为家教老师,虽然也是大模型的一部分,但更准确地说,应该称为“AI Agent”(人工智能体)。GPT4o将AI Agent作为大模型的另一种“打开方式”带入大众视野。

微软公司创始人比尔·盖茨写道,作为下一个平台,Agent彻底改变了应用软件的打开方式,是一次影响深远的交互革命。用户将不再搜索网站,不再登陆生产力网站,不再去网站购物,而是一律委托给Agent。

AI Agent正在成为大模型未来的入口。而这个入口背后带来的交互改变,正在广泛地影响每一个人。

Agent限定LLM幻觉,LLM加速Agent进化

对于Agent的定义,OpenAI应用研究主管Lilian Weng曾发表万字长文来论述,概括起来就是一个公式:“Agent=大型语言模型(LLM)+记忆(Memory)+规划(Planning)+工具使用(Tool)”。

其中,LLM被视为驱动Agent的大脑。但这颗大脑并不是完美的,他有一个难以被解决的问题——幻觉。而缓解幻觉的有效方式就是,通过添加条件来限制模型的想象力。

这从而引出了规划项的作用。规划项里的“条件”,实际上包含了很多SOP(制定标准作业程序),以此加强模型专业性。而这个包含了限定条件的集成,就是最初级的Agent。

而这些SOP作为企业内部数据资产,对于AI Agent来说则是“知识”。此外,容纳知识多少,决定了AI Agent的聪明程度。也就是说,记忆力越强的Agent能力越强。

对此,澜码科技创始人兼CEO周健在接受21世纪经济报道记者采访时称,具备短时记忆力的AI Agent只进行碎片化问答,对应的只能完成简单的工作。而拥有长时记忆的AI Agent将像人一样,根据某种逻辑将过往记忆组织起来,同时后续在执行计划的时候,还能调用记忆进行自我反馈、自我修正。

随着底层大模型能力日益增强,模型将能使Agent记住更多的企业数据资产。同时,在开发周期和训练成本上,也将变得更低。这无疑加速了Agent进化得速度。Lilian Weng甚至在文章中表示,AI Agent将成为大语言模型的下半场。

不过,周健认为,当前AI Agent还处于非常早期的阶段,因为即便是GPT4o也只具备短时记忆,在长时记忆、社会智力和逻辑推理方面的能力并没有显著提升。

中国B端将先崛起

与此前中国软件行业发展相似的是,中国在AI软件发展上也是B端先于C端。

无论是去年的百模大战,还是正在上演的“以厘计价”大模型价格战,都证明了中国B端生态的烈度。而这使得中国在AI Agent发展上,也是企业级Agent跑在更前面。

周健认为,这或许与人力成本因素有关。由于北美和欧洲由于人工较贵,在上一代AI出来的时候,就已经做了很多类似于智能客服的B端应用探索,可以说在欧美to B数字化中,低垂的果实已经被采摘完了。而中国正好与此相反,中国用户一开始在C端的付费意愿弱,反倒是在能够提质增效上的B端更有付费意愿。叠加,此前4G时代中国诞生了字节跳动、阿里巴巴等C端交互平台。这也给后续进入C端赛道的AI Agent公司不少压力。

还有多位创业者对记者表示,目前中国B端出现大模型价格战,实际上有利于初创企业的发展。

原因在于,发展大模型有一个类似摩尔定律的Scaling Law,通俗点说,大模型参数往后若想提升一级,在资金消耗上将成指数级增长,但提升效果却呈现边际效应递减。因此,大模型厂商之间相互“卷”能力和资源,不仅能为初创公司创造更好用、更具性价比的AI工具,还能为他们培养更多人才。而这也是当初周健在创业时优先从B端切入,打造企业级AI Agent的原因之一。

此外,在AI Agent硬件端初阶形态里,也是能带动更多B端生产力的AIPC,有望更先一步突破。对此,一家尝试把大模型折叠进入手机的创始人这样解释道,手机硬件水平整体偏弱,例如手机打游戏久了会发烫,因此对能耗上的限制更多。同时,手机生态更为封闭,APP之间的生态并不相通。因此,办公用的AIPC将比AI手机更先面世。

无论是软件端还是硬件端土壤,都更有利于中国Agent在B端先实现百花齐放。

为生态带来新可能

那么对于企业来说,Agent究竟能够带来哪些改变?

在周健看来,AI Agent是一种新质生产力,它集成了专家知识、数据、模型和算力四大生产要素,以类似智能的专家服务这样的生产力的形态出现,可以极大满足企业自动化数字化升级需求,甚至彻底颠覆企业形态。

他解释称,若是多个AI Agent能够彼此协作,将打破现有公司的组织形态。今后Agent将作为顶层规划者自动依据业务难度、员工能力等指标对工作进行分解、再分配,让企业内部管理走向任务自主化分配、流程自动化迭代。这不仅为流程及组织的提效创造更多价值,也使得员工与AI Agent之间的交互方式,从当前的人机协同,走向人机融合、甚至人机共生。

同时,Agent这种交互能力还能改变行业。目前线上销售更为精准,关键在于背后有大数据做支撑,例如利用A/B testing做产品定价等。而线下销售没有这么丰富的数据做支撑。若是把AI Agent与线下销售人员搭配在一起工作,将能把线上电商已经实现的个性化销售策略,在线下业务中再实现一遍。同时,线上和线下的数字化联动,也能为销售管理带来更大赋能。

此外,Agent还将加速行业整体生态发生改变。周健在采访中提到,在B端Agent商业模式上,澜码采用先与头部客户合作共建定制版Agent。当高阶Agent产品打磨好后,再以此为准将现有产品改良为通用版Agent,向腰部以下客户渗透大模型的先进能力,从而提升整体行业整体水平。

这件事若是放在之前,对于不少行业腰部以下客户而言将是一件不敢想象的事情。除了大模型研发成本昂贵以外,更关键的是小企业内部缺乏训练数据,这导致行业尾端企业很难用上大模型这样的先进生产力工具。而以Agent为载体,将能使大模型的能力以更轻量的方式进行复制。周健形容,这就好像一种财政上的转移支付,有着更强数据能力的头部,承担了初期训练Agent上的试错成本。在之后将开发红利由头部向尾部传递,这将对行业综合数字化水平的提升十分显著。

同时,开发不同版本的Agent,还将使得大模型在商业模式变得更加灵活。对此,周健将其形容为从CAPEX到OPEX。此前,在使用算力模型时,是将其作为一个这个整体来计算成本,需要提前支付算力采购费、云端使用费等大额投入;但若是将Agent当成按次使用的数字员工来算计算月薪,则将按使用次数给Agent平台进行业务收益分成,将能使大模型的能力精准滴灌到每位员工身上。

如此一来,AI Agent进入日常工作,对企业甚至员工而言都将不再是高不可攀的事情。那么对于人类来说,一天只工作四小时的日子,也许就快到来。

(作者:石恩泽 编辑:孙超逸)

石恩泽向TA提问

记者

跟数据有关的赛道都看。有好故事微信联系:lulu_shienze,加微信请先备注。