人工智能Claude在操控机器狗方面超越人类:是突破还是暂时异常?

人工智能市场继续展现出能力的指数级增长。这一次,Anthropic公司公布了Project Fetch实验的更新结果,对传统上人类在工程任务中的优势地位提出了质疑。Claude Opus 4.7模型完成了一套配置和控制机器狗的综合任务,速度比经验丰富的人类工程师团队快20倍。
值得回顾的是,早在2024年8月,该公司没有机器人技术经验的员工就曾尝试对四足机器人进行编程。当时,AI仅扮演辅助角色,加速了解决方案的寻找。然而,在新的测试阶段,Claude Opus 4.7在研究人员的最低限度监控下几乎完全自主运行。
神经网络的自主运行
在实验过程中,该模型自主完成了一系列关键操作:
- 连接视频传感器和激光雷达;
- 编写手动控制程序;
- 创建机器人路线监控系统;
- 配置物体识别算法。
结果令人印象深刻:Opus 4.7比使用先前版本AI的团队快18倍,比没有聊天机器人辅助的人类快37倍。同时,神经网络生成了更高效的代码——其代码量比人类团队少10倍。这不仅说明了速度,也体现了解决方案的质量。
值得注意的是,据开发者称,机器人技术的进步是语言模型整体规模扩展的副产品。Anthropic并未引入专门用于控制“硬件”的算法——这是在训练过程中自然发生的。
并非一帆风顺:物理限制
然而,尽管在编程方面取得了令人瞩目的成功,Claude在精确的物理动作方面仍然面临严重困难。该模型能够将机器人引导至目标,但未能完成将球轻轻推到指定点的任务。这需要复杂的实时反馈,而人类在这方面目前仍保持优势。
Anthropic相信,行业正在进入“物理AI代理”时代。未来,神经网络将能够像现在处理软件代码一样高效地使用标准工具和设备。提醒一下,6月13日,由于美国政府根据出口管制指令,Anthropic被迫停止了对Fable 5和Mythos 5模型的访问。
我的分析:这一实验不仅是技术上的奇闻,更是一个明确的信号,表明数字世界与物理世界之间的界限正在模糊。然而,投资者和开发者应牢记:尽管AI在逻辑和算法任务上表现出色,但真正的“物理交互”仍然是其致命弱点。这既带来了高估其能力的风险,也为那些能将神经网络力量与精确机械相结合的人创造了巨大机遇。