把大模型「放进电脑里」,会出现一种很奇特的反差: 它能写代码、能推理、能把论文总结得头头是道;但一旦让它去操作 Excel、Word 这种真实桌面软件,却像第一次用电脑的人 -- 点错菜单、来回切换,甚至在同一页里循环点击。 很多人第一反应会觉得是 Agent 没看清按钮,或者没理解任务,不知道界面上各个选项是什么意思。但在真实软件里,更大的问题往往不是「看不见」,而是「不知道点下去会发生什么」。
【新智元导读】GPT-5.4,已经把白领桌面一口吞下!1M上下文,原生Computer Use,Excel直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被AI彻底颠覆了吗?
GPT-5.4,已经把白领桌面一口吞下!1M 上下文,原生 Computer Use,Excel 直接变身数据分析平台;超越麦肯锡,取代投行律所咨询公司不是梦。白领工作,要被 AI 彻底颠覆了吗? 前天,OpenAI 发布了 GPT-5.4,震惊了整个 AI 圈。100 万 token 的上下文,「编程 + 智能体」的巨大飞跃,原生的 computer use,所有这些,都将彻底改变 AI 智能体 ...
就在刚刚,OpenAI 头号竞争对手 Anthropic 推出了 “computer use” 功能,让 Claude 能够像人类一样操作电脑了!看屏幕、动光标、点按钮、打字等。通过 API,开发者可以让 Claude 将指令翻译成计算机指令,从而解放一些枯燥的重复性流程任务。 一、西方的Anthropic 的 ...
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using ...
从协作到执行,桌面 Agent 正在重塑 AI 在现实世界中的角色。它为办公效率提供了前所未有的可能,也带来了系统权限与隐私边界的深层挑战。 效率与隐私的博弈,并非此消彼长,而是需要通过制度设计达成新的平衡。当 AI 开始“动手”,监管与产品设计也必须同步进化。否则,执行能力越强,风险外溢越快。
发布名叫Computer Use的新功能,可以让Claude像人一样使用计算机! 话不多说,直接来看例子: 在这个填写表格的例子中,由于涉及到的数据分散在了电脑不同的位置,如果人工挨个寻找,那叫一个费时费力。 现在,你只需要跟Claude说一声即可,然后它就会先“看 ...
为了揭开真相,有人亲自对GPT-5.4进行了大半天的测试,得出的结论是:它确实取得了显著进步,但远未达到宣传中的神奇程度。测试过程中,有些场景令人惊叹,有些则让人哭笑不得。可以确定的是,ChatGPT-5.4绝非仅仅内置了一个OpenClaw那么简单,它标志着ChatGPT终于学会了“动手”。
OpenAI最新发布的GPT-5.4模型引发科技圈热议,其内置的"原生电脑操控能力"成为焦点。这项被称作Native Computer Use的技术突破,标志着人工智能开始具备直接操作计算机的物理能力,而不再局限于文字交互层面。
当地时间2月25日,AI企业Anthropic宣布收购西雅图AI初创公司Vercept,以补齐旗下智能体工具Computer Use的视觉短板。 Computer Use是Anthropic为旗下大模型Claude打造的核心能力,于2024年10月随Claude 3.5 Sonnet一同推出,可支持Claude像人类一样完成看屏幕、操控键鼠、操作软件等动作,处理多步骤跨应用复杂任务,是Anthro ...