AI手机进入Agent时代:苹果、谷歌、豆包手机走向同一条路
AI手机进入Agent时代,苹果Siri、谷歌Gemini、豆包等正从语音助手升级为能理解场景、操作应用的系统级智能助手,核心是让AI“完成任务”而非仅回答问题。
21世纪经济报道记者雷晨
近日,苹果在WWDC26上发布新版Siri AI,引发行业关注。发布会上,苹果用较大篇幅介绍了Siri的升级,并将其定位为更深度整合进 iPhone的系统级智能入口。
按照苹果的介绍,新版Siri AI不仅具备更自然的对话能力,还可以理解用户屏幕上的内容,结合个人上下文,在消息、邮件、照片等应用之间搜索信息,并在需要时联网获取答案,完成任务。
这意味着,Siri AI的升级已经不只是“语音助手变聪明”这么简单,它所指向的,是手机AI助手角色的变化:从过去回答问题、执行简单指令的工具,逐步变成能够理解用户场景、连接应用服务,并参与任务执行的系统级助手。
这种变化并非苹果一家独有。过去一年,海外手机与AI硬件厂商都在寻找类似方向。
谷歌正在Android中推进Gemini Intelligence,让手机助手能够结合屏幕内容、图片和用户当前场景提供服务。据报道,在与三星合作的 Galaxy S26 上,相关能力还将进一步深入到第三方应用场景中,帮助用户完成点外卖、叫车等服务。另有消息称,OpenAI也在加速开发一款以ChatGPT为核心体验的AI手机,最快可能在2027年量产。
国内厂商也已开始探索类似方向。去年年底,豆包手机助手与中兴合作推出努比亚M153,能够帮助用户完成下单等任务,被外界视为AI手机助手落地的代表产品之一,也在海内外引发讨论。
可以看到,“让AI理解并操作手机”正在成为全球手机AI助手的共同命题。随着大模型能力进入操作系统层,手机助手的角色正在从“被动响应”走向“主动协助”。这也在改变手机交互的竞争逻辑:谁能让AI更准确地理解用户需求,并稳定完成更多复杂任务,谁就更有可能掌握下一代手机交互的主动权。
围绕这一目标,行业正在探索多种技术路径,包括GUI Agent、App Intents、MCP标准化接口等。其中,GUI Agent让AI像用户一样“看懂”手机界面,识别屏幕上的按钮、输入框、菜单和页面结构,再通过点击、滑动、输入等方式完成任务。它不完全依赖应用提前开放接口,因此更适合处理长尾场景和复杂流程。
在智能化方面,各家厂商都在不同方向上并行演进,持续探索和融合。但海内外目标是一致的:让AI助手从“会回答问题”走向“能完成任务”。未来的手机助手,可能不会只依赖某一种技术,而是将系统接口、应用开放能力与GUI Agent结合起来,在不同场景下选择最合适的方式执行任务。
过去,手机交互的中心是应用和界面;未来,AI 助手可能成为新的操作层。这也意味着,更智能的手机助手正在成为全球手机产业共同押注的方向。
(作者:雷晨 编辑:骆一帆)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。


