Grok Build 遭批评声浪:开发者将 xAI 工具与 Claude Code 及 Codex 进行对比
埃隆·马斯克近日在社交平台X上发布了一条请求批评其新产品Grok Build的帖子,回应了一位用户的热情赞美。然而,社区的反应远非乐观。这位亿万富翁的帖子下出现了数十条评论,其中相当一部分指出了该工具的弱点。让我们来探讨一下Grok Build的问题所在,以及为什么马斯克的粉丝认为Anthropic和OpenAI等竞争对手已经遥遥领先。
什么是Grok Build?它的优势在哪里?
Grok Build是xAI推出的一款用于开发的代理型CLI工具,于2026年5月进入早期测试阶段。它直接在终端中运行,仅对SuperGrok和X Premium Plus订阅用户开放。访问费用约为每月300美元,这使得该产品与Claude Code和GitHub Copilot处于同一价格区间。
对于复杂任务,开发者设计了规划模式:用户可以批准计划、评论单个步骤或在执行前完全重写。之后,每个更改都会以差异形式(显示文件两个版本之间逐行差异)呈现。基础模型Grok 4.3 beta采用16个代理的架构和200万令牌的上下文窗口,该工具能够同时运行多达八个并行代理。听起来令人印象深刻,但在实践中却并非如此。
与竞争对手的比较不利于xAI
评论中最常见的话题是与Claude Code和OpenAI Codex的比较。不幸的是,这些比较几乎总是对Grok不利。一位开发者描述了一个直接实验:Grok花了近两天时间处理一个项目的实现,之后同样的任务量被切换到Codex。结果,竞争对手在六小时内进展了两倍之多。
另一位用户声称,Grok在三十分钟内陷入了无限循环,而Opus一次就解决了同样的问题。第三位专家指出,Grok CLI的推理速度相比Claude Code和Codex感觉太慢,导致观察代理工作变得不舒适。
此外,还有观点认为Grok擅长深度研究,但在复杂的自主编码方面明显逊于对手。这是一个严重的信号:如果该工具无法处理基本的开发任务,其对专业社区的价值将急剧下降。
功能需求和桌面应用程序
相当一部分反馈涉及系统缺失的功能。用户强烈要求创建类似于Claude Cowork的官方桌面应用程序。他们指出,Claude的主要优势在于与工作流程各个方面的集成,而不仅仅是编写代码。
此外,还提出了以下功能请求:
- 在测试阶段发布产品的开源版本;
- 引入完整的循环功能;
- 创建/goal命令以实现代理的稳定自主工作;
- 集成内置功能,无需导出即可演示正在创建的软件。
反馈渠道问题也被单独提出。一位用户承认,在结果不理想后,他不知道通过哪些渠道发送反馈。这相当引人注目,因为xAI在CLI中直接内置了/feedback命令。看来,即使是基本的用户交互机制仍然不够明显。
价格与限制:经济因素对抗开发者
订阅费用在专业人士中引发了另一波批评。用户抱怨强制绑定昂贵的SuperGrok套餐,并建议引入更实惠的层级。此外,他们还抱怨严格的令牌限制和每天仅15分钟的Grok Premium访问时间。
下表总结了我的主要投诉:
| 问题 | 用户投诉的实质 |
|---|---|
| 高入门门槛 | 强制绑定昂贵的SuperGrok套餐 |
| 使用限制 | 令牌限制和每天仅15分钟Grok Premium |
| 地理限制 | 担心xAI会重蹈Claude退出欧洲的覆辙 |
讽刺与怀疑:社区对马斯克帖子的反应
马斯克帖子的形式本身引发了讽刺性反应。几位用户注意到,请求批评性反馈的同时,他引用了一位热情粉丝的话,这位粉丝几乎是在表白对产品的爱。一位评论者称,转发自己的赞美之词是一种特殊的自信表现。
与此同时,部分观众仍然对公司保持忠诚。有人感谢团队的快速迭代,并声称产品正在迅速改进。一些人甚至预测Grok很快将成为市场上最好的工具。然而,这些声音明显是少数。
Cryptalist分析师结论
马斯克帖子下的反馈汇总显示,营销宣传与实际开发者评估之间存在明显差距。Grok Build以大上下文和多代理架构脱颖而出,但在实际任务中,用户发现其在自主编码质量、速度和稳定性方面落后于成熟的Claude Code和Codex。
因此,主要投诉归结为三个方面:
- 质量和可靠性:循环、回归以及在直接测试中输给竞争对手。
- 生态系统:缺乏桌面应用程序、开源版本和一系列代理功能。
- 经济因素:高价格和严格的令牌限制。
早期测试阶段和内置的反馈机制为xAI提供了直接渠道,以便快速改进产品。然而,在我看来,要赶上领导者,公司不仅需要修复错误,还需要从根本上重新审视自主编码和用户体验的方法。目前,Grok Build是一个有前途但尚未成熟的工具,在所有关键指标上都输给了更成熟的解决方案。