跳转至

Twitter AI 编程 - 2026-04-13

1. 人们在讨论什么

1.1 Claude Code 遇上 Google Antigravity:集成热潮与反弹(🡕)

当天最高分推文来自 @TawohAwa,他 发布了一份分步教程,讲解如何把 Claude Code 与 Google Antigravity 组合起来:“如果把 Claude code 和 Google Antigravity 结合起来,你就可以自动化并构建任何东西。” 这条教程串推讲解了如何下载 Antigravity、在其中安装 Claude Code VS Code 扩展,并激活集成。该帖获得 92 个赞和 155 次收藏——这是今日数据集中最高的收藏数,说明强烈的保存以供参考行为。

这股热情并非没有受到挑战。@pcshipp 回击 并发布了当天回复数最多的帖子(54 条回复):“Antigravity 是 Google 创造的最失败产品之一。即使免费,它仍然无法与 Cursor、Codex 和 Claude code 等工具竞争。质量 >> 免费。” 与此同时,@lMDU1zXxSEbWc5c 报告 称“google antigravity 挂了吗?没有响应!”——这个可靠性问题进一步强化了质量抱怨。

@alvinfoo 梳理了 Google 更广泛的 AI 生态,列出从 Gemini 到 Veo 再到 Antigravity 的 11 个工具,并认为“Google 拥有最好的 AI 工具生态,而且差距非常明显。” 一张 配套信息图 展示了完整栈,包括 Firebase Studio、Google App Builder,以及横跨 Sheets 和 YouTube 的 Gemini 集成。

@xdadevelopers 发布了为期一个月的对比,比较 Cursor、Claude Code 和 Google Antigravity,并宣布“有一个明确赢家”。配图显示 Claude Code 的 Cowork 模式正在构建一个带实时预览的响应式 Next.js 作品集网站。

分裂很清楚:Antigravity 的免费定价吸引了教程创作者和生态倡导者,但使用过替代方案的实践者看到的是一个免费也无法弥合的质量差距。昨天的报告指出,开发者正在围绕 2-3 个付费订阅整合;今天的数据则显示,这个免费档竞争者很难进入那个组合。

1.2 OpenAI Codex 转变为超级应用(🡕)

@chetaslua 分享了 Codex “Super App”转型的首批公开截图,获得 185 个赞和 19,339 次浏览——是当天最高浏览量。截图展示了一个桌面应用:左侧有项目侧边栏(列出 “droid-swift”、“agent-coworker”、“kotlin-openclaw” 等项目)、内置浏览器面板,以及智能体式任务提示,例如“审查我最近的提交是否有正确性风险”和“解除我最近打开的 PR 的阻塞”。

Codex Super App 界面,显示项目侧边栏、浏览器面板,并选中了 GPT-5.4 Extra High 模型

第二张截图显示了新的 UI 自定义界面,提供 “Basic”(相同工具,更简单界面)和 “Advanced”(用于编程和开发)两种模式,表明 OpenAI 正在按用户专业度细分 Codex 体验。

Codex UI 自定义界面,提供 Basic 和 Advanced 两种界面模式

在回复中,@MichaelAluya3 提出了安全担忧:“不要忽视上周末 Axios compromise 的新闻。OpenAI 刚因为 macOS 签名流程遭遇供应链攻击而轮换了安全证书。” 这个警告与产品热情同时出现,凸显了快速发布功能与供应链安全之间的张力。

昨天的报告标记了 Anthropic 与 OpenAI 之间的桌面应用竞赛。今天的截图显示,Codex 并不只是给 CLI 工具加一个 GUI 外壳——它正在构建一个完整的桌面开发环境,集成浏览、项目管理和多模型支持(状态栏中可见 GPT-5.4 Extra High)。

1.3 GitHub Copilot CLI 走向远程与移动端(🡕)

两篇帖子记录了 GitHub Copilot CLI 能力的一次重要扩展。@msdev 演示 了一个板球计分应用:使用三条 Copilot CLI 命令,在 30 分钟内做出成品,分别是 /plan 用来确定范围,/autopilot 用来构建,/fleet 用来扩展。该帖获得 77 个赞和 47 次收藏。

另外,@GHchangelog 宣布 远程控制 CLI 会话进入公开预览。更新日志文章 详细说明,copilot --remote 会把 CLI 活动实时串流到 GitHub。用户可以从 Web 或移动端监控和引导会话,包括:发送会话中的引导消息、审查和修改计划、在 plan/interactive/autopilot 模式之间切换、批准或拒绝权限请求,以及回应 ask_user 提示。/keep-alive 命令可防止机器在长任务期间休眠。该功能已在 Android beta 和 iOS TestFlight 上可用。

@h34j3j8j 询问了差异:Copilot 在 IntelliJ 中的 “Ask” 模式和 “Agent” 模式有什么不同,并这样描述差别:“Ask 会告诉我在哪里做、做什么。Agent 会真的去做。” 配图显示 IDE 状态栏中的模式下拉菜单(Ask、Edit (Deprecated)、Agent、Plan)。

GitHub Copilot 模式选择器,显示 Ask、Edit Deprecated、Agent 和 Plan 选项

远程会话、移动访问和 /fleet 扩展命令的汇合,表明 Copilot CLI 正在从本地编程助手转向设备无关的开发平台。

1.4 MCP 扩展到企业与 Web3(🡕)

Model Context Protocol 今天出现在三个不同语境中,显示出采用范围正在变宽。

@rezadorrani 演示 了 Power Apps Authoring MCP Server,它可以使用 GitHub Copilot CLI 和 Claude Code 构建 Canvas Apps。在回复中,@PromptSlinger 提出了关键架构问题:“MCP server 是真的直接操作 canvas app 组件吗?还是更像生成 YAML 再导入?” @oscar_ster3808 给出了更宽泛的评估:“MCP 正在悄悄吃掉中间件栈。当 Claude Code 成为企业工具的主界面时,谁能构建什么的问题会彻底改变。”

@dungeonroll 宣布 在 Anthropic MCP Registry 上发布,使使用 Claude Code 或 Claude Desktop 的 AI agents 能够“注册斗士、押注 ETH,并自主战斗至死”。这代表 MCP 使用场景正在从开发者工具扩展到区块链游戏——智能体直接与智能合约互动。

@DataChaz 重点介绍了 Multica,这是 Claude Managed Agents 的开源克隆,几天内达到 4,000+ GitHub star。Multica 与 Claude Code、OpenAI Codex、OpenClaw 和 OpenCode 集成,提供自托管智能体基础设施,具备可复用 skills、多工作区隔离和共享人类-AI 看板。其工作流——启动 daemon、分配 ticket、隔离 workspace、实时 WebSocket 更新——复刻了 Anthropic 的托管方案,但运行在开发者自己的服务器上。

1.5 AI 工具熟练度成为工作要求(🡒)

@degensing 梳理了九类工程角色的 AI 工具要求,获得 90 个赞:开发者需要 Cursor + GitHub Copilot,QA 需要 Playwright + Testim,DevOps 需要 Terraform + Claude,数据工程师需要 Airflow + dbt + AI pipelines,后端需要 Docker + Cursor + system design,网络安全需要 Burp Suite + ChatGPT,SRE 需要 Datadog + Claude,数据分析师需要 Power BI + ChatGPT,嵌入式需要 TensorFlow Lite 做 edge AI。结论是:“工具变了。职位名称没有变。”

回复收敛到同一个主题。@GoldilocksOrbit:“工具正在跑赢职位描述,现在就是这样。” @galles72480:“工作流熟练度是新的优势。” @GlennisHaw20741:“差距在采用速度,而不是技能。”

这条串推呼应了 @clairevo 关于 Claude Cowork 的 播客单集,其中明确把 Cowork 定位为教授“Claude Code 心智模型,而不需要打开终端”的工具——填补了如今需要 AI 熟练度的非编码角色所面对的可访问性缺口。


2. 令人困扰的问题

Claude Code token 膨胀与幽灵 token(High)

三个独立来源记录了 Claude Code 中过度 token 消耗的问题。@de1lymoon 以在 Google 11 年的经验 报告:“Claude 有 40% 的时间会破坏约定……一个隐藏 bug 烧掉 20,000 个幽灵 token。” 单个 markdown 规则文件把约定违规率从 40% 降到了 3%。@grok 佐证 称,“较新的 Claude Code 版本(2.1.100+)每次请求会注入约 20k 额外服务端 token,这已由 HTTP 代理测试、Reddit 分析和公开 GitHub issue 确认。” @a_lamparelli 展示截图,显示一次没有工具调用的 “continue” 命令就消耗了 2% 会话用量。/context 拆解揭示了开销:system prompt 7k tokens(3.5%)、system tools 8.9k(4.5%)和 autocompact buffer 33k(16.5%)——这还没算任何用户消息。

Claude Code 上下文用量显示 200k token 中已使用 49.5k,并按类别给出详细拆解

这延续了昨天报告中的缓存 TTL 和 token 成本担忧,今天的证据则增加了具体版本号和独立验证方法。

Gemini CLI 账号封禁(Medium)

@championswimmer 报告 称,自己在几乎不使用 Gemini CLI 的情况下遭遇账号封禁,提示信息为“此账号中的该服务因违反服务条款已被停用”。用户指出这属于一种模式:“奇怪的 CLI 工具封禁还在继续。” @justcardz 建议使用 Google 表单申诉,并称一小时内可以解决。

Gemini CLI 终端显示账号因违反服务条款被禁用,并给出申诉说明

Google Antigravity 质量与可靠性(Medium)

@pcshipp 通过 宣称“Antigravity 是 Google 创造的最失败产品之一。即使免费,它仍然无法与 Cursor、Codex 和 Claude code 等工具竞争”引来 54 条回复——是数据集中最高。另有 @lMDU1zXxSEbWc5c 报告 直接宕机。54 条回复的讨论量说明,这不是孤立抱怨,而是广泛存在的挫败感。

Claude Code 学习曲线(Low)

@zodchiii 幽默记录 了典型 Claude Code 用户旅程:“输入一个很长的 prompt,得到结果,自己重写一切,发现 Claude 有 /commands,原来 checkpoint 一直都在文档里。” 这个笑话有效,是因为它描述了一种常见经历:用户在学会 /commands、/clear 和斜杠命令等内置功能之前,会浪费 token 和精力。


3. 人们期望的功能

Token 成本透明度与可观测性

@a_lamparelli截图 显示,Claude Code 的 /context 命令会给出 token 拆解,但一次 “continue” 带来的 2% 会话消耗对用户仍然无法解释。@grok 指出,约 20k 服务端 token 注入并未记录在文档中。再加上昨天的缓存 TTL 回归报告,用户持续要求实时成本可见性和可预测计费。这些信息存在于服务端,但没有以可执行形式呈现给开发者。

感知约定的 AI 编程智能体

@de1lymoon 展示,单个 markdown 文件就能把 Claude Code 约定违规率从 40% 降到 3%。“开箱可用”和“正确遵守团队约定”之间的差距,目前靠手动配置来填补。一个能自动检测并适应项目约定的智能体——lint 规则、命名模式、架构决策——如果无需手写规则文件,就能解决 Claude Code 最常见的失败模式。

移动优先的智能体式开发

GitHub 的 远程 CLI 会话 开始满足这一需求,但该功能仍处于公开预览阶段,移动应用可用性有限(Android beta、iOS TestFlight)。来自 @msdev 获得 47 次收藏的帖子以及远程会话公告的需求信号表明,开发者希望从任意设备监控、引导和批准智能体工作——而不只是从运行 CLI 的那台机器。


4. 使用中的工具与方法

工具 类别 评价 优势 局限
Claude Code 编程智能体 两极分化 与 Antigravity 深度集成;面向非编码者的 Cowork 模式;可通过 markdown 规则文件修复约定违规 token 膨胀(v2.1.100+ 中 20k+ 幽灵 token);单次 continue 消耗 2% 会话;无配置时约定违规率 40%
GitHub Copilot CLI CLI 智能体 正面 /plan、/autopilot、/fleet 工作流;远程会话(Web + 移动端);设备无关 远程会话处于公开预览;Business/Enterprise 需要管理员策略
OpenAI Codex 桌面应用 正面 Super App,带浏览器集成、项目侧边栏、Basic/Advanced UI 模式;GPT-5.4 Extra High 供应链安全担忧(Axios compromise、证书轮换)
Google Antigravity IDE(VS Code fork) 两极分化 免费;广泛集成 Google AI 生态 质量抱怨;报告出现宕机;54 条回复的反弹串推;“无法与 Cursor、Codex、Claude Code 竞争”
Cursor IDE + AI 正面 作为对比 Antigravity 的质量标杆;与 Claude 搭配用于快速迭代 今天提到过,但未深入讨论
Multica 智能体基础设施 正面 开源 managed agents;4,000+ star;集成 Claude Code、Codex、OpenClaw、OpenCode 新项目;生产就绪程度不明
Claude Cowork 非编码者智能体 正面 “Brain” 文件提供持久上下文;3 个 AI review personas;无需终端即可教授 Claude Code 心智模型 局限于非编程工作流
Power Apps MCP Server 企业 MCP 正面 通过 Copilot CLI 和 Claude Code 构建 Canvas Apps 不清楚是直接操作还是生成 YAML

5. 人们在构建什么

项目 功能 解决的问题 技术栈 阶段 链接
Multica 开源社区,由 @DataChaz 重点介绍 自托管 managed agent 基础设施,带可复用 skills、工作区隔离、共享人类-AI 看板 Anthropic 的 managed agents 绑定云和定价;此前没有自托管替代方案 Claude Code、Codex、OpenClaw、OpenCode、WebSocket 已上线(4,000+ star) 推文
Codex Super App OpenAI,由 @chetaslua 展示 完整桌面开发环境,集成浏览器、项目管理、智能体式任务、UI 自定义 Codex 过去只像聊天工具;开发者需要在一个窗口中获得浏览器、代码和项目上下文 GPT-5.4、Codex desktop 内部预览 推文
Copilot CLI Remote Sessions GitHub,由 @GHchangelog 宣布 通过实时同步,从 Web 或移动端监控并引导 CLI 会话 CLI 会话绑定本地机器,无法移动端访问 Copilot CLI、GitHub web、GitHub Mobile 公开预览 更新日志
Power Apps Authoring MCP Server Microsoft,由 @rezadorrani 演示 使用 Copilot CLI 或 Claude Code 通过 MCP 构建 Canvas Apps 低代码应用构建需要手动 UI;没有通过 MCP 的 AI 辅助创作 Power Apps、MCP、.pa.yaml 已上线 视频
Dungeon Roll MCP Server @dungeonroll AI agents 通过 MCP 注册斗士、押注 ETH 并自主战斗 AI agents 没有与链上游戏交互的标准方式 Claude Code、Claude Desktop、Anthropic MCP Registry、Ethereum 已上线(已在 MCP Registry 验证) 推文
Looped @uselooped 聚合 ChatGPT、Claude Code、Jira 和 GitHub 中的上下文 开发者上下文散落在多个 AI 和项目工具中 跨平台集成 已上线($9.99/月) 推文

6. 新动态与亮点

GitHub Copilot CLI 远程会话进入公开预览。 copilot --remote 命令会把 CLI 活动实时串流到 GitHub,使用户能从 Web 或移动端监控和引导。功能包括会话中消息、计划审查、模式切换,以及从任意设备批准权限。Android beta 和 iOS TestFlight 已可用。(更新日志)

OpenAI Codex “Super App”截图浮出水面。 首批公开图片显示,Codex 正从聊天界面转变为完整桌面开发环境,带集成浏览器、项目侧边栏和 Basic/Advanced UI 模式。GPT-5.4 Extra High 是默认模型。同一串推中也标记了供应链安全事件(Axios compromise、macOS 签名证书轮换)。(推文)

Multica 作为开源托管智能体基础设施达到 4,000+ star。 该项目复刻 Anthropic 的 Managed Agents,但以自托管方式运行,并与 Claude Code、Codex、OpenClaw 和 OpenCode 集成。提供可复用 skills、工作区隔离和共享人类-AI 任务看板。(推文)

Claude Code v2.1.100+ 已确认每次请求注入约 20k 服务端 token。 HTTP 代理测试和 Reddit 分析的独立验证佐证了未记录 token 开销的报告。一名 Google 工程师还单独量化了约定违规率(基线 40%,使用 markdown 规则文件后 3%)和幽灵 token 消耗(每个隐藏 bug 20,000)。(推文, 推文)

MCP 进入 Anthropic Registry,用于 Web3 游戏。 Dungeon Roll 作为已验证 MCP server 发布,使 AI agents 能够自主押注 ETH 并执行链上游戏动作——这是一种新颖的 agent-to-blockchain 互动模式。(推文)


7. 机会在哪里

[+++] 强:自托管智能体基础设施

Multica 几天内获得 4,000+ star,量化了市场对云锁定托管智能体平台的自托管替代方案需求。Anthropic 的 Managed Agents 要求使用其云和定价;企业团队需要能在自有服务器上运行、同时可选择模型(Claude、GPT、开源)的智能体编排。这个模式——daemon、ticket 分配、隔离 workspace、实时更新、可复用 skills——已经被 Multica 证明可行。机会在于把它加固到企业可用:SOC 2 合规、审计日志、基于角色的访问控制,以及与现有 CI/CD pipeline 集成。任何构建智能体基础设施的团队都应该密切关注这一领域。

[++] 中等:面向 AI 编程工具的 token 成本可观测性

今天的数据为昨天的缓存 TTL 担忧增加了具体证据。@a_lamparelli/context 截图显示,系统开销(prompt + tools + autocompact buffer)在单条用户消息之前就消耗约 50k token。@grok 引用了 v2.1.100+ 中每次请求约 20k 额外服务端 token。@de1lymoon 报告每个隐藏 bug 会消耗 20,000 个幽灵 token。一个能让这些成本可见、可预测、可优化的代理或仪表盘,将服务每个触达限制的 Claude Code 用户。数据存在,但没有以可操作方式呈现出来。

[++] 中等:MCP 作为通用中间件层

MCP 今天出现在三个彼此无关的语境中:企业低代码(Power Apps)、Web3 游戏(Dungeon Roll)和智能体基础设施(Multica)。@oscar_ster3808 捕捉到了趋势:“MCP 正在悄悄吃掉中间件栈。” 机会在 MCP 工具链——发现、测试、安全扫描和 MCP server 监控——因为该协议正在成为 AI 智能体与外部系统之间的默认集成层。Anthropic MCP Registry 是正在出现的应用商店;帮助开发者发布、验证和维护 MCP server 的工具可以填补基础设施缺口。

[+] 新兴:非编码者 AI 熟练度工具

@clairevo 对 Cowork 的描述——“教你 Claude Code 心智模型,而不需要打开终端”——以及 @degensing 对九类非开发工程角色 AI 工具要求的梳理,都指向一个增长中的受众:他们需要 AI 熟练度,但不具备 CLI 熟练度。“brain” 文件模式(一个告诉 AI 你是谁、你如何工作的持久上下文文档)是一种工作流创新,可从 Cowork 泛化到任何 AI 工具。面向特定角色的 AI 熟练度模板和培训材料(QA、DevOps、SRE、Data)代表一个服务不足的市场。

[+] 新兴:设备无关的智能体式开发

GitHub 的远程 CLI 会话和 Codex 的桌面 Super App 都在解决同一个限制:智能体式编程工作流被锁定在单一设备上。机会在于能支持设备间无缝交接的工具层——在工作站上启动任务,从手机监控,从平板批准权限。GitHub 通过 copilot --remote 拥有先发优势,但这种模式可泛化到任何 CLI 智能体。面向移动端的智能体引导界面(不只是监控)是下一步。


8. 要点总结

  1. Google Antigravity 让 AI 编程社区两极分化。 当天最高推文(155 收藏)推广 Claude Code + Antigravity 集成,而回复数最多的帖子(54 回复)称 Antigravity 是“最失败产品之一”。在与 Cursor、Codex 和 Claude Code 的质量与可靠性差距面前,免费定价并没有胜出。(教程, 批评)

  2. OpenAI 正在把 Codex 从聊天工具转变为完整桌面开发环境。 首批截图展示了集成浏览器、项目管理侧边栏、智能体式任务提示和 UI 自定义(Basic vs Advanced 模式)。这超出了昨天的“桌面应用竞赛”——它是一场平台化布局。(截图)

  3. GitHub Copilot CLI 正变得设备无关。 远程会话、移动访问和 /fleet 扩展命令把 Copilot CLI 定位成开发平台,而不仅是本地工具。从“在你的机器上运行”转向“从任意设备引导”,改变了 CLI 智能体可以是什么。(更新日志)

  4. Claude Code token 开销现在已有独立量化。 2.1.100+ 版本每次请求注入约 20k 额外服务端 token。系统开销(prompt + tools + buffer)在用户消息之前就消耗约 50k token。单个 markdown 规则文件能把约定违规率从 40% 降到 3%。修复存在,但需要手动设置。(token 证据, 约定修复)

  5. MCP 正从开发者工具扩展到企业和 Web3。 Power Apps MCP Server、Anthropic MCP Registry 上的 Dungeon Roll、以及 Multica 的多工具智能体基础设施,都把 MCP 作为集成层。该协议正在成为中间件。(Power Apps, Dungeon Roll)

  6. 自托管智能体基础设施存在强需求。 Multica 作为 Anthropic Managed Agents 的开源克隆,几天内获得 4,000+ star,证实云锁定的智能体编排是障碍。开源社区在一周内构建了替代方案。(Multica)

  7. AI 工具熟练度正在成为跨角色要求,而非只属于开发者的技能。 九类工程角色现在都有未明说的 AI 工具要求。竞争优势是“采用速度,而不是技能”。Claude Cowork 和类似工具是非编码者的入口。(角色梳理, Cowork guide)