Twitter AI Coding - 2026-05-25¶

1. 人们在讨论什么¶

1.1 成本、配额和限流开始替人选择智能体 🡕¶

最强信号的讨论簇，讲的是支出上限，而不是基准测试炫耀。Microsoft 的许可证收缩、GitHub Copilot 的倍率截图，以及 Antigravity 的配额绕行方案，都把 AI 编码先塑造成预算问题，而后才是模型选择问题。就连 Antigravity 的正面发布消息，重点也放在更低的 token 消耗和配额重置上，而不是新能力。

@Pirat_Nation 表示，Microsoft 在 AI 账单失控后，正在缩减内部对 Claude Code 的使用，并把部分团队推向 GitHub Copilot（1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏）。信息流里其他地方转引的报道，把细节说得更清楚：The Verge 称，Experiences + Devices 正在于 6 月 30 日前逐步取消大多数 Claude Code 许可证，但仍会通过 Copilot CLI 提供 Anthropic 模型；因此，这更像是成本控制和运行框架收敛，而不是放弃 AI。

@ardadev 直接总结了这条纠正信息，并附上拟议中的 Community Note，同时链接了同样的 Verge 和 Windows Central 报道（8 次点赞、727 次浏览）。

拟议 Community Note 的截图，说明 Microsoft 因成本取消 Claude Code 许可证，并引导工程师转向 GitHub Copilot CLI，而不是禁止 AI

@testingcatalog 报道，Antigravity 新增了 Gemini 3.5 Flash (Low)，并引用 Google 的说法称，它相比 Flash Medium 大约可减少 45% 的 token 消耗，同时突出付费计划的配额重置（356 次点赞、25 条回复、24,999 次浏览、30 次收藏）。@ai_for_success 又补充，这个新档位现在也已经出现在 CLI 里了（140 次点赞、8 条回复、7,039 次浏览、14 次收藏）。

Antigravity 模型选择器，展示 Gemini 3.5 Flash (Low) 以及付费计划的配额重置提示

Antigravity CLI 1.0.0 的模型切换器，展示 Gemini 3.5 Flash (Low) 已出现在可选档位里

@balakoteswar 贴出了一张 GitHub Docs 截图，显示年付计划中的模型倍率大幅上调，其中 Claude Opus 4.5 从 3x 涨到 15x，Claude Sonnet 4.6 从 1x 涨到 9x（4 次点赞、378 次浏览）。

GitHub Copilot 计费截图，展示年付计划里更高的模型倍率，包括 Claude Opus 和 Claude Sonnet 档位的大幅跳涨

讨论要点： 回复区并没有不假思索地庆祝更便宜的档位。一条 Flash Low 帖子下面就有人问，这个变化是不是只多买到“5 分钟”的配额；而 Microsoft 那条讨论串则把读者引向 Community Note 更正和媒体报道链接，而不是病毒式的“AI 禁令”说法。

与前日对比： 5 月 24 日还主要把配额痛点当成 Antigravity 内部的产品摩擦。到了 5 月 25 日，同样的抱怨上升了一个层级：Microsoft 许可证、Copilot 倍率，以及模型限制重置，都让预算算术成了主导叙事。

1.2 模型之上的竞争，正在加厚成工作流文件、记忆和编排层 🡕¶

最强的工作流帖子，不是在说“这是一个更好的模型”，而是在说“我是怎么把多个智能体接起来的”“我是怎么教助手遵守我的约定的”“我是怎么让同一套工作流在工具切换后仍能延续的”。这让这一天看起来更像是一场控制平面之争，而不是某个最佳 UI 的单点竞争。

@Teknium 宣布，现在只要装一个技能，Hermes Agent 就能编排 OpenHands（58 次点赞、8 条回复、2,271 次浏览、47 次收藏）。随附信息图把这个集成讲得很具体：OpenHands 变成了 Hermes 的一个可选技能，背后由 LiteLLM 提供对 Anthropic、OpenAI、DeepSeek、Qwen、Ollama、vLLM 和 Nous 的支持，同时还带有明确的无头模式 flags。

Hermes Agent 信息图，说明如何把 OpenHands 作为一个可选技能安装和运行，并展示 LiteLLM 支持的模型以及无头模式 flags

@EXM7777 认为，真正厉害的用户在 Claude Code、Codex 和 OpenCode 上能拿到相近的质量，因为他们理解失效模式、指令结构、智能体系统、记忆架构，以及价格 / 质量之间的取舍（54 次点赞、19 条回复、2,097 次浏览、44 次收藏）。有条回复把这个想法又往前推了一步：真正的优势，在于把这些原则编码进能跟着每一次会话、每一个工具一起移动的文件里。

@code 推广了一场 Microsoft Build 会议，主题是 GitHub Copilot 为什么会丢失上下文（59 次点赞、7 条回复、6,326 次浏览、17 次收藏）；而会议页面写道，Copilot 可以借助共享规则、可复用提示词、技能和自定义智能体，学会团队约定，并能从 5 名工程师扩展到 500 名。

@PhilSeamark 写道，他把 VS Code 加 GitHub Copilot 当成一个“给知识工作者，不是给开发者”的个人生产力环境（54 次浏览）；其链接的设置指南描述了晨间简报、转录导入、Power Automate 文件投递、可搜索聊天记录，以及同一工作区里的 subagents。

@dosco 表示，Ax/Aithy 的核心设计优势，在于把对话历史当成可供检查和提炼的结构化数据来处理（27 次点赞、3 条回复、878 次浏览、20 次收藏）。他附上的评审截图则把更难的要求说得很明白：缺的仍是一条一等公民的编程智能体工具通道，里面要有带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪。

评审截图，列出带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪等编程智能体需求

讨论要点： Teknium 的回复区在要预设组合和更少的无关文件改动，而 EXM7777 的回复区则在问，怎样让那些来之不易的原则可迁移。真正的实际问题，是如何把工作流打包到能跨工具切换继续存活，而不是本周到底哪个界面赢了。

与前日对比： 5 月 24 日强调的是订阅路由和本地模型。5 月 25 日则在这层路由之上，又加厚了一层规则、技能、记忆和被委派的智能体。

1.3 构建者在既有智能体周围打包专用适配层，而不是正面取代它们 🡕¶

最清晰的项目分享帖，都是在一个流行运行框架上补一项缺失能力：语义代码智能、合规知识、提供商自由，或更快的远程接线能力。这是一种不同于“再发一个新助手”的构建模式，更像是给人们已经信任的智能体去补基础设施。

@pvergadia 重点提到了 codegraph，把它列为本周 GitHub 增长最快的仓库之一（1 次点赞、185 次浏览、5 次收藏）。公开的 colbymchenry/codegraph 仓库把它描述成一套面向 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes Agent 的 TypeScript 语义代码知识图谱；README 还声称，在 7 个代码库上的平均基准测试里，它能节省 35% 的成本，并减少 71% 的工具调用。

@VivekIntel 分享了 mlunato47/claude-grc-plugin（3 次点赞、110 次浏览、3 次收藏）；其 README 写道，它能为 Claude Code 和 OpenCode 提供 72 份以上的参考文件、15 套框架，以及 24 个面向 FedRAMP、NIST 800-53、CMMC、SOC 2、ISO 27001、HIPAA 等合规工作流的 slash commands。

@Liz_Binance 指向了 ajsai47/backdoor（2 次点赞、2 条回复、806 次浏览），这个 Python proxy 的 README 写道，它能把 Claude Code 重路由到 DeepSeek、Groq、Ollama、OpenRouter 和 NVIDIA NIM 等 OpenAI 兼容提供商上。那条帖子真正有用的部分，不是那个未经证实的“copied” 指控，而是它展示了一层公开的路由层，专门用来保留 Claude Code 的运行框架，同时替换底层模型和价格点。

@tmsdnl 表示，一个 Codex 功能请求从 GitHub issue 到合并只花了 10 小时 41 分钟，并附上了新的 app-server WebSocket 流程和 /status 输出截图（2 次点赞、272 次浏览）。即便这只是个小功能，它也说明市场更奖励薄适配层和快速工作流修补，而不是重新发明全栈。

讨论要点： 这些构建者不断从一个强势的既有智能体出发，再补一块缺的能力：语义上下文、合规知识、提供商自由或委派执行。这个模式是叠加式的，不是替代式的。

与前日对比： 5 月 24 日已经出现了工作流专用技能包。5 月 25 日则把这个趋势扩展成更专门的基础设施层：知识图谱、合规插件、提供商代理，以及编排技能。

2. 令人困扰的问题¶

任务还没做完，配额就先耗尽了¶

严重程度：高。@air_codex 表示，自己只发了 6 个提示词，就先被封 2 小时，随后又因为反复出现“high traffic”失败而被封 4 天，尽管做的只是基础 CSS 和 TSX 工作（43 次浏览）。随附截图之所以重要，是因为它把一种模糊抱怨变成了具体失效模式：先是活干完后立刻弹出流量错误，然后是配额页面显示 Flash、Gemini 3.1、Claude 4.6 和 GPT-OSS 档位都只剩 0%。@testingcatalog 报道 Flash Low 是一种节省 45% token 的修补方案（356 次点赞、25 条回复、24,999 次浏览、30 次收藏），但回复区立刻追问，这是不是只多买来几分钟的可用工作时间。@balakoteswar 贴出的 Copilot 倍率截图，又说明 GitHub 这一侧的高端模型成本压力也在上升（4 次点赞、378 次浏览）。可见的应对模式，是降级模型、等待重置，或改走更便宜的后端。这个方向值得做，因为失效点会直接打断任务，而不是只影响观感。

Antigravity 截图，展示活干完后立刻出现的 high-traffic 失败

Antigravity 配额页面，展示 Flash、Gemini 3.1 Pro、Claude 4.6 和 GPT-OSS 档位都已耗尽，只能等未来时间刷新

公开的 AI 编码讨论，在头条传播后仍需要纠偏¶

严重程度：中。@Pirat_Nation 把 Microsoft 的成本故事传播到了大范围用户面前（1,460 次点赞、122 条回复、79,463 次浏览、181 次收藏），但紧接着的一层讨论就是纠偏：@ardadev 转发了 Community Note 和源报道，说明 Microsoft 取消的是 Claude Code 许可证，并把团队导向 Copilot CLI，而不是禁止 AI（8 次点赞、727 次浏览）。Google 那边也出现了更柔和的同类模式。@DuaFatimaAi 重复了那套熟悉的 NotebookLM + Antigravity 组合宣传（45 次点赞、17 条回复、443 次浏览、9 次收藏），但帖子并没有提供超出搭建口号之外的新证据。当前的绕行机制，是读者自己把文章链接、截图和纠错信息带回讨论串。这件事值得做，因为验证如今正在变成产品发现的一部分。

编排工具仍在逼用户自己拼预设组合¶

严重程度：中。@Teknium 宣布了一个有用的 Hermes + OpenHands 技能（58 次点赞、8 条回复、2,271 次浏览、47 次收藏），但马上就有回复说：“你们很快就需要预设组合了。”这样新用户才不用手动改每个设置。@dosco 则用更技术化的语言说了同一件事（27 次点赞、3 条回复、878 次浏览、20 次收藏）：智能体架构仍然需要带边界的仓库搜索、事务性 patch、诊断、回滚和来源追踪，才会显得完整。@EXM7777 认为，现在的绕行方式就是个人基础设施：理解原则，把它们编码进可迁移文件，再在工具之间随身带着走（54 次点赞、19 条回复、2,097 次浏览、44 次收藏）。这个方向值得做，因为眼下的绕行方案仍然全靠手工自建。

3. 人们期望的功能¶

与智能体行为匹配的突发定价和配额仪表盘¶

最强的需求不是又一个抽象基准测试，而是一个能告诉你任务会花多少钱、哪些档位已经耗尽、什么时候刷新，以及更便宜的档位到底能不能把活干完的系统。@air_codex 从用户侧展示了这种失效模式（43 次浏览），@balakoteswar 从套餐侧暴露了倍率变化（4 次点赞、378 次浏览），而 Microsoft 的报道则给出了同一问题的企业版本。机会：直接。

能在工具切换后继续存活的可迁移工作流包¶

@EXM7777 认为，原则比界面更耐久（54 次点赞、19 条回复、2,097 次浏览、44 次收藏）；而 Microsoft Build 会议页面也明确把规则、提示词文件、技能和自定义智能体描述成向 Copilot 传授团队约定的方式。@PhilSeamark 又展示了同一需求在非开发者场景里的样子（54 次浏览）：真正的资产，是一套可复用工作流，能处理转录、日历、笔记和历史，而不是每次都从零开始。机会：直接且具竞争性。

面向受监管工作和非代码工作的领域专用智能体层¶

围绕 claude-grc-plugin 和 Phil Seamark 那套 Copilot 工作流的构建活动，都在暗示同一个缺口：通用智能体仍需要一层会说用户领域语言的外壳。前者意味着 FedRAMP、NIST 800-53 和文档审查命令，后者意味着客户笔记、差旅管理、产品反馈和日记式工作流。机会：直接。

用安全的多智能体预设替代白纸一张式编排¶

在 @Teknium 的公告下，回复区要的是预设组合（58 次点赞、8 条回复、2,271 次浏览、47 次收藏）；@dosco 则把缺失的护栏正式列了出来（27 次点赞、3 条回复、878 次浏览、20 次收藏）：带边界的仓库搜索、事务性编辑、诊断、回滚和来源追踪。人们真正想要的，看起来是一个值得信任的起点，而不是一袋旋钮。机会：具竞争性。

4. 使用中的工具与方法¶

工具	类别	评价	优势	局限
GitHub Copilot / Copilot CLI	编程助手 / 运行框架	(+/-)	一方产品支持规则、提示词文件、技能和自定义智能体；同时出现在企业和知识工作流场景里	倍率变化和套餐算术正在收紧；部分采用来自成本和内部 dogfooding 决策推动
Claude Code	编程智能体	(+/-)	仍然足够受欢迎，以至于 Microsoft 需要主动缩减许可证；强运行框架催生了路由和代理项目	企业成本压力是真实存在的，设置蔓延也是反复出现的抱怨
Google Antigravity	智能体运行时 / IDE / CLI	(+/-)	新增 Flash Low，覆盖多个表面，仍能吸引偏自动化的用户	高频失效、难用配额和反复出现的宣传帖持续削弱信任
Gemini 3.5 Flash (Low)	模型档位	(+/-)	主打比 Flash Medium 约省 45% token，并已进入 Antigravity 各端	用户仍在质疑，在配额触顶前它到底能多买来多少实际空间
Hermes Agent	编排运行框架	(+)	支持可安装技能，以及跨多个智能体后端的委派执行	回复区表明，用户想要更安全的预设、更明确的组合，以及更少的无关文件改动
OpenHands	自治编程智能体	(+)	现在能被 Hermes 联合多个 LiteLLM 提供商一起编排	复杂度仍然会通过 flags 和环境变量泄漏出来
CodeGraph	语义代码智能	(+)	预索引本地图谱有望减少工具调用、降低成本，并加快多种智能体的代码库探索	需要索引工作流，目前看起来仍偏早期基础设施软件
GRC Knowledge Plugin	领域插件	(+)	为 Claude Code 和 OpenCode 加入合规映射、文档审查和操作命令	除非你在受监管环境工作，否则仍偏小众
Backdoor	提供商代理	(+)	保留 Claude Code 的运行框架，同时切到更便宜、本地或其他提供商	早期设置负担较重，且受提供商兼容性约束
VS Code + Copilot + Power Automate files	工作流模式	(+)	能把编程环境变成全天候工作区，用来处理转录、日记、客户笔记和 subagents	目前更像一套自定义栈，而不是默认产品体验

整体满意度最高的场景，是工具能提升可移植性，或把真实工作流知识打包起来的时候；最低的场景，则是用量上限或计费倍率打断工作的时候。实际迁移模式，并不是从工具 A 干净切换到工具 B，而是路由和叠层：保留人们喜欢的运行框架、替换提供商、加一个语义索引、加一个领域插件，或接入一个被委派的智能体。竞争焦点正在从单纯的模型质量，向上下文、编排和价格控制上移。

5. 人们在构建什么¶

项目	构建者	功能	解决的问题	技术栈	阶段	链接
OpenHands skill for Hermes	@Teknium	让 Hermes 以一个可安装技能来编排 OpenHands	开发者希望用一个控制平面去委派另一个编程智能体，而不是把所有事都塞进同一闭环	Hermes Agent, OpenHands CLI, LiteLLM, Anthropic/OpenAI/DeepSeek/Qwen/Ollama/vLLM/Nous	已发布	推文
CodeGraph	colbymchenry	面向多个智能体客户端的预索引语义代码知识图谱	减少代码库探索时的 token 浪费和工具调用蔓延	TypeScript, SQLite/FTS, MCP, Claude Code/Codex/Cursor/OpenCode/Hermes integrations	已发布	仓库
GRC Knowledge Plugin	mlunato47	为 Claude Code 和 OpenCode 增加合规框架、映射和审查命令	通用编程智能体并不了解受监管文档和审计工作流	JavaScript plugin, 72+ reference files, 24 slash commands, Claude Code, OpenCode	已发布	仓库
Backdoor	ajsai47	让 Claude Code 通过任意 OpenAI 兼容或本地提供商运行	团队想保留 Claude Code 的运行框架，但不想接受 Anthropic 单一价格或锁定	Python proxy, OpenAI-compatible APIs, DeepSeek, Groq, Ollama, OpenRouter, NVIDIA NIM	Beta	仓库
Codex app-server support	@tmsdnl	新近合并的远程 / app-server 工作流扩展能力	用户想让 Codex 与本地或远程服务层对话，而不是被困在单一 shell 流里	Codex, WebSockets, app-server status plumbing	Alpha	推文

@Teknium 宣布的 Hermes + OpenHands 技能，是一个真正可安装的工件，而不只是概念（58 次点赞、8 条回复、2,271 次浏览、47 次收藏）。附图展示了准确的安装命令、OpenHands 已支持的 flags，以及模型无关的后端列表，所以回复区才会立刻开始要求预设组合和更安全的默认值。

@pvergadia 重点提到 CodeGraph 在每周仓库榜单上的上升（1 次点赞、185 次浏览、5 次收藏）；而仓库本身写得很直白：它要让 Claude Code、Codex CLI、Cursor、OpenCode 和 Hermes 更便宜、更轻，因为它给这些工具提供了一个预索引图谱，而不是逼它们反复读文件。@VivekIntel 分享了 GRC Knowledge Plugin（3 次点赞、110 次浏览、3 次收藏）；其 README 则把这种打包动作说得更明确：参考文件、slash commands 和框架映射，都被包在现有智能体外面。

榜单截图，显示 CodeGraph 位列本周 GitHub 增长最快仓库前列

GRC Knowledge Plugin 的 README 截图，列出面向 Claude Code 和 OpenCode 的合规框架、参考文件与命令

@Liz_Binance 指向了 Backdoor，其 README 写道，它能把 Claude Code 重路由到 DeepSeek、Groq、OpenRouter、Ollama 和 NVIDIA NIM 等提供商（2 次点赞、2 条回复、806 次浏览）。@tmsdnl 又给出了一个更小但很有代表性的例子：一个 Codex 功能请求在 10 小时 41 分钟内上线，截图里新的 app-server 流程已经跑通（2 次点赞、272 次浏览）。

Codex app-server 截图，展示快速从 issue 到合并后，本地 WebSocket 端点和状态输出已经可用

这 5 个例子背后反复出现的构建模式非常一致：如果你能让一个流行智能体更便宜、更懂领域、更容易路由，或更容易委派执行，就没有必要重新发明它。这也是为什么当天最强的项目，看起来像适配器、插件、图谱和编排技能，而不是新基础模型。

6. 新动态与亮点¶

搜索热度飙升的速度，可能快于广泛使用的扩散速度¶

@RealNickMugalli 认为，在 Opus 4.5 之后，Claude Code 的搜索热度一路垂直上升，而 Codex 则稍晚一步跟上；他附上了一张 Google US 的 AI 编程智能体搜索图表（2 次点赞、322 次浏览）。图表本身支持这个判断里较窄的部分：围绕 Claude Code 和 Codex 的关注度，在 2025 年末到 2026 年初明显加速。这件事之所以重要，是因为它与当天其他证据相吻合：虽然重度用户群仍然相对小，但规模已经大到足以把企业预算痛点暴露出来。

Google US 搜索趋势图，对比 2025 年 1 月至 2026 年 5 月间 Claude Code 与 OpenAI Codex 的热度

即便曝光不高的独立构建者，也开始晒出营收截图¶

@adensdk 声称，一个由 AI 构建的应用已经带来了超过 $13,000 的收入，并附上了一张 RevenueCat 截图，显示上一年收入为 $13,230（5 次点赞、3 条回复、284 次浏览、2 次收藏）。帖子没有披露技术栈，这个数字也是自报，因此应谨慎看待。但它仍然重要，因为它构成了一个反向信号：就在企业抱怨 token 预算的同一天，小体量构建者账号仍在晒出变现证明点。

RevenueCat 截图，展示一个自称由 AI 构建的应用在上一年取得了 $13,230 收入

7. 机会在哪里¶

[+++] 预算感知路由、配额预测和突发定价 — 第 1 节显示，Microsoft 和 GitHub 的决策都开始围绕支出上限转弯；第 2 节则展示了即便 Google 推出 Flash Low，Antigravity 用户仍会在任务中途被卡住。Backdoor 已经是构建者给出的回应，而这通常说明痛点既真实又紧迫。

[++] 可迁移的工作流包与记忆层 — 第 1.2 节和第 3 节都在说明：规则、提示词文件、技能、subagents 和持久工作区，正在变成高于任何单个模型之上的耐久资产。这个机会强度中等，因为一方产品已经交付了部分能力，但跨工具版本仍然是开放地带。

[++] 现有运行框架的专用插件 — 第 5 节里最强的构建者例子是 CodeGraph、GRC Knowledge Plugin 和 Backdoor。这 3 个项目的共同点，都是围绕既有智能体提供更窄但更有力的增益，而不是试图彻底替换它，因此这看起来更像一个可信的产品类别，而不是一次性 hack。

[+] AI 工具话语的验证与纠偏层 — 第 2 节展示了头条叙事和宣传式设置帖有多快就需要纠错。这个机会还在涌现，因为现在读者已经在靠 Community Notes、截图和源链接手工做这项工作。

8. 要点总结¶

企业支出正在开始主导工具选择。 Microsoft 的 Experiences + Devices 团队正在逐步取消大多数 Claude Code 许可证，并计划在 6 月底前把许多开发者导向 Copilot CLI，这让成本和组织内部杠杆都成了产品决策的一部分。(source)
更便宜的模型档位，并不能单独解决配额焦虑。 Flash Low 带着节省 45% token 的宣传上线，但用户仍在晒出只做了基础工作就触发高流量和 0 剩余额度的截图。(source)
更耐久的层，正在移动到模型之上。 Hermes + OpenHands 的编排、Microsoft Build 对规则和技能的强调，以及面向知识工作的 Copilot 设置，都把工作流文件、技能和记忆当成了真正的长期优势。(source)
构建者正在靠适配层赢。 CodeGraph、GRC Knowledge Plugin、Backdoor，以及 Codex 的 app-server 变更，都在既有智能体周围增加杠杆，而不是试图正面替代它们。(source)
注意力和收益仍然高度集中。 一张 Google 搜索趋势图显示，Claude Code 和 Codex 的关注度正在快速上升；与此同时，就在企业抱怨成本的同一天，小体量构建者账号仍在晒出自报营收截图。(source)