智能涌现⑳｜人工智能体AI Agent到来如何成为大模型未来入口

深公司Insight

石恩泽 2024-06-05 16:32

大语言模型的下半场

关联内容

21世纪经济报道记者石恩泽深圳报道

“我希望你能通过问题引导让他（我儿子）真正理解这道（数学）题，而不是直接给他答案。”网络教育平台可汗学院创始人萨尔·可汗在一则OpenAI发布的视频中，向GPT4o下达着指令。

接受GPT4o指令的“她”，作为家教老师，虽然也是大模型的一部分，但更准确地说，应该称为“AI Agent”（人工智能体）。GPT4o将AI Agent作为大模型的另一种“打开方式”带入大众视野。

微软公司创始人比尔·盖茨写道，作为下一个平台，Agent彻底改变了应用软件的打开方式，是一次影响深远的交互革命。用户将不再搜索网站，不再登陆生产力网站，不再去网站购物，而是一律委托给Agent。

AI Agent正在成为大模型未来的入口。而这个入口背后带来的交互改变，正在广泛地影响每一个人。

Agent限定LLM幻觉，LLM加速Agent进化

对于Agent的定义，OpenAI应用研究主管Lilian Weng曾发表万字长文来论述，概括起来就是一个公式：“Agent=大型语言模型（LLM）+记忆（Memory）+规划（Planning）+工具使用（Tool）”。

其中，LLM被视为驱动Agent的大脑。但这颗大脑并不是完美的，他有一个难以被解决的问题——幻觉。而缓解幻觉的有效方式就是，通过添加条件来限制模型的想象力。

这从而引出了规划项的作用。规划项里的“条件”，实际上包含了很多SOP（制定标准作业程序），以此加强模型专业性。而这个包含了限定条件的集成，就是最初级的Agent。

而这些SOP作为企业内部数据资产，对于AI Agent来说则是“知识”。此外，容纳知识多少，决定了AI Agent的聪明程度。也就是说，记忆力越强的Agent能力越强。

对此，澜码科技创始人兼CEO周健在接受21世纪经济报道记者采访时称，具备短时记忆力的AI Agent只进行碎片化问答，对应的只能完成简单的工作。而拥有长时记忆的AI Agent将像人一样，根据某种逻辑将过往记忆组织起来，同时后续在执行计划的时候，还能调用记忆进行自我反馈、自我修正。

随着底层大模型能力日益增强，模型将能使Agent记住更多的企业数据资产。同时，在开发周期和训练成本上，也将变得更低。这无疑加速了Agent进化得速度。Lilian Weng甚至在文章中表示，AI Agent将成为大语言模型的下半场。

不过，周健认为，当前AI Agent还处于非常早期的阶段，因为即便是GPT4o也只具备短时记忆，在长时记忆、社会智力和逻辑推理方面的能力并没有显著提升。

中国B端将先崛起

与此前中国软件行业发展相似的是，中国在AI软件发展上也是B端先于C端。

无论是去年的百模大战，还是正在上演的“以厘计价”大模型价格战，都证明了中国B端生态的烈度。而这使得中国在AI Agent发展上，也是企业级Agent跑在更前面。

周健认为，这或许与人力成本因素有关。由于北美和欧洲由于人工较贵，在上一代AI出来的时候，就已经做了很多类似于智能客服的B端应用探索，可以说在欧美to B数字化中，低垂的果实已经被采摘完了。而中国正好与此相反，中国用户一开始在C端的付费意愿弱，反倒是在能够提质增效上的B端更有付费意愿。叠加，此前4G时代中国诞生了字节跳动、阿里巴巴等C端交互平台。这也给后续进入C端赛道的AI Agent公司不少压力。

还有多位创业者对记者表示，目前中国B端出现大模型价格战，实际上有利于初创企业的发展。

原因在于，发展大模型有一个类似摩尔定律的Scaling Law，通俗点说，大模型参数往后若想提升一级，在资金消耗上将成指数级增长，但提升效果却呈现边际效应递减。因此，大模型厂商之间相互“卷”能力和资源，不仅能为初创公司创造更好用、更具性价比的AI工具，还能为他们培养更多人才。而这也是当初周健在创业时优先从B端切入，打造企业级AI Agent的原因之一。

此外，在AI Agent硬件端初阶形态里，也是能带动更多B端生产力的AIPC，有望更先一步突破。对此，一家尝试把大模型折叠进入手机的创始人这样解释道，手机硬件水平整体偏弱，例如手机打游戏久了会发烫，因此对能耗上的限制更多。同时，手机生态更为封闭，APP之间的生态并不相通。因此，办公用的AIPC将比AI手机更先面世。

无论是软件端还是硬件端土壤，都更有利于中国Agent在B端先实现百花齐放。

为生态带来新可能

那么对于企业来说，Agent究竟能够带来哪些改变？

在周健看来，AI Agent是一种新质生产力，它集成了专家知识、数据、模型和算力四大生产要素，以类似智能的专家服务这样的生产力的形态出现，可以极大满足企业自动化数字化升级需求，甚至彻底颠覆企业形态。

他解释称，若是多个AI Agent能够彼此协作，将打破现有公司的组织形态。今后Agent将作为顶层规划者自动依据业务难度、员工能力等指标对工作进行分解、再分配，让企业内部管理走向任务自主化分配、流程自动化迭代。这不仅为流程及组织的提效创造更多价值，也使得员工与AI Agent之间的交互方式，从当前的人机协同，走向人机融合、甚至人机共生。

同时，Agent这种交互能力还能改变行业。目前线上销售更为精准，关键在于背后有大数据做支撑，例如利用A/B testing做产品定价等。而线下销售没有这么丰富的数据做支撑。若是把AI Agent与线下销售人员搭配在一起工作，将能把线上电商已经实现的个性化销售策略，在线下业务中再实现一遍。同时，线上和线下的数字化联动，也能为销售管理带来更大赋能。

此外，Agent还将加速行业整体生态发生改变。周健在采访中提到，在B端Agent商业模式上，澜码采用先与头部客户合作共建定制版Agent。当高阶Agent产品打磨好后，再以此为准将现有产品改良为通用版Agent，向腰部以下客户渗透大模型的先进能力，从而提升整体行业整体水平。

这件事若是放在之前，对于不少行业腰部以下客户而言将是一件不敢想象的事情。除了大模型研发成本昂贵以外，更关键的是小企业内部缺乏训练数据，这导致行业尾端企业很难用上大模型这样的先进生产力工具。而以Agent为载体，将能使大模型的能力以更轻量的方式进行复制。周健形容，这就好像一种财政上的转移支付，有着更强数据能力的头部，承担了初期训练Agent上的试错成本。在之后将开发红利由头部向尾部传递，这将对行业综合数字化水平的提升十分显著。

同时，开发不同版本的Agent，还将使得大模型在商业模式变得更加灵活。对此，周健将其形容为从CAPEX到OPEX。此前，在使用算力模型时，是将其作为一个这个整体来计算成本，需要提前支付算力采购费、云端使用费等大额投入；但若是将Agent当成按次使用的数字员工来算计算月薪，则将按使用次数给Agent平台进行业务收益分成，将能使大模型的能力精准滴灌到每位员工身上。

如此一来，AI Agent进入日常工作，对企业甚至员工而言都将不再是高不可攀的事情。那么对于人类来说，一天只工作四小时的日子，也许就快到来。

（作者：石恩泽编辑：孙超逸）

南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权，任何人不得以任何方式使用。详情或获取授权信息请点击此处。

关联专题